क्यू-लर्निंग

लेखक: Roger Morrison
निर्माण की तारीख: 24 सितंबर 2021
डेट अपडेट करें: 11 मई 2024
Anonim
क्यू-लर्निंग समझाया - एक सुदृढीकरण सीखने की तकनीक
वीडियो: क्यू-लर्निंग समझाया - एक सुदृढीकरण सीखने की तकनीक

विषय

परिभाषा - Q- अधिगम का क्या अर्थ है?

क्यू-सीखना एक एल्गोरिथ्म संरचना के लिए एक शब्द है जो मॉडल-मुक्त सुदृढीकरण सीखने का प्रतिनिधित्व करता है। नीति का मूल्यांकन करने और स्टोकेस्टिक मॉडलिंग का उपयोग करके, क्यू-लर्निंग एक मार्कोव निर्णय प्रक्रिया में सबसे अच्छा रास्ता खोजता है।


Microsoft Azure और Microsoft क्लाउड का परिचय | इस गाइड के दौरान, आप जानेंगे कि क्लाउड कंप्यूटिंग क्या है और Microsoft Azure आपको क्लाउड से अपना व्यवसाय चलाने और चलाने में कैसे मदद कर सकता है।

Techopedia Q-Learning की व्याख्या करता है

क्यू-लर्निंग एल्गोरिदम के तकनीकी मेकअप में एक एजेंट, राज्यों का एक सेट और प्रति राज्य कार्यों का एक समूह शामिल है।

Q फ़ंक्शन रिवार्ड्स को वैल्यू रिवार्ड के साथ विभिन्न चरणों के लिए वेट का उपयोग करता है।

यद्यपि यह एक सरल विचार की तरह लग सकता है, क्यू-लर्निंग कई प्रकार के सुदृढीकरण सीखने और गहन शिक्षण मॉडल में सबसे महत्वपूर्ण है। सबसे अच्छा उदाहरणों में से एक है, जहां गहरे क्यू-लर्निंग का उपयोग मशीन सीखने के कार्यक्रमों को विभिन्न प्रकार के वीडियो गेम में गेम-प्ले रणनीतियों को सीखने में मदद करने के लिए किया जाता है, उदाहरण के लिए, 1980 के दशक से अटारी गेम में। यहां एक दृढ़ तंत्रिका नेटवर्क गेम-प्ले के नमूने लेता है ताकि एक स्टोकेस्टिक मॉडल का काम किया जा सके जो कंप्यूटर को यह जानने में मदद करेगा कि समय के साथ गेम को बेहतर तरीके से कैसे खेलें।


क्यू-लर्निंग में कृत्रिम बुद्धिमत्ता और मशीन लर्निंग को आगे बढ़ाने में मदद करने की प्रचुर क्षमता है।