क्यू-लर्निंग

वीडियो: क्यू-लर्निंग समझाया - एक सुदृढीकरण सीखने की तकनीक

विषय

परिभाषा - Q- अधिगम का क्या अर्थ है?
Microsoft Azure और Microsoft क्लाउड का परिचय | इस गाइड के दौरान, आप जानेंगे कि क्लाउड कंप्यूटिंग क्या है और Microsoft Azure आपको क्लाउड से अपना व्यवसाय चलाने और चलाने में कैसे मदद कर सकता है।
Techopedia Q-Learning की व्याख्या करता है

परिभाषा - Q- अधिगम का क्या अर्थ है?

क्यू-सीखना एक एल्गोरिथ्म संरचना के लिए एक शब्द है जो मॉडल-मुक्त सुदृढीकरण सीखने का प्रतिनिधित्व करता है। नीति का मूल्यांकन करने और स्टोकेस्टिक मॉडलिंग का उपयोग करके, क्यू-लर्निंग एक मार्कोव निर्णय प्रक्रिया में सबसे अच्छा रास्ता खोजता है।

Microsoft Azure और Microsoft क्लाउड का परिचय | इस गाइड के दौरान, आप जानेंगे कि क्लाउड कंप्यूटिंग क्या है और Microsoft Azure आपको क्लाउड से अपना व्यवसाय चलाने और चलाने में कैसे मदद कर सकता है।

Techopedia Q-Learning की व्याख्या करता है

क्यू-लर्निंग एल्गोरिदम के तकनीकी मेकअप में एक एजेंट, राज्यों का एक सेट और प्रति राज्य कार्यों का एक समूह शामिल है।

Q फ़ंक्शन रिवार्ड्स को वैल्यू रिवार्ड के साथ विभिन्न चरणों के लिए वेट का उपयोग करता है।

यद्यपि यह एक सरल विचार की तरह लग सकता है, क्यू-लर्निंग कई प्रकार के सुदृढीकरण सीखने और गहन शिक्षण मॉडल में सबसे महत्वपूर्ण है। सबसे अच्छा उदाहरणों में से एक है, जहां गहरे क्यू-लर्निंग का उपयोग मशीन सीखने के कार्यक्रमों को विभिन्न प्रकार के वीडियो गेम में गेम-प्ले रणनीतियों को सीखने में मदद करने के लिए किया जाता है, उदाहरण के लिए, 1980 के दशक से अटारी गेम में। यहां एक दृढ़ तंत्रिका नेटवर्क गेम-प्ले के नमूने लेता है ताकि एक स्टोकेस्टिक मॉडल का काम किया जा सके जो कंप्यूटर को यह जानने में मदद करेगा कि समय के साथ गेम को बेहतर तरीके से कैसे खेलें।

क्यू-लर्निंग में कृत्रिम बुद्धिमत्ता और मशीन लर्निंग को आगे बढ़ाने में मदद करने की प्रचुर क्षमता है।