डीप क्यू-नेटवर्क

वीडियो: Deep Q-Learning - Combining Neural Networks and Reinforcement Learning

विषय

परिभाषा - डीप क्यू-नेटवर्क्स का क्या अर्थ है?
Microsoft Azure और Microsoft क्लाउड का परिचय | इस गाइड के दौरान, आप जानेंगे कि क्लाउड कंप्यूटिंग क्या है और Microsoft Azure आपको क्लाउड से अपना व्यवसाय चलाने और चलाने में कैसे मदद कर सकता है।
Techopedia डीप Q-Networks की व्याख्या करता है

परिभाषा - डीप क्यू-नेटवर्क्स का क्या अर्थ है?

डीप क्यू नेटवर्क्स (DQN) तंत्रिका नेटवर्क (और / या संबंधित उपकरण) हैं जो बुद्धिमान क्यू वीडियो गेम खेलने के सिमुलेशन के रूप में मॉडल प्रदान करने के लिए गहन क्यू लर्निंग का उपयोग करते हैं। एक विशिष्ट न्यूरल नेटवर्क बिल्ड के लिए एक विशिष्ट नाम होने के बजाय, डी क्यू नेटवर्क नेटवर्क और अन्य संरचनाओं से बना हो सकता है जो विभिन्न प्रक्रियाओं के बारे में जानने के लिए विशिष्ट तरीकों का उपयोग करते हैं।

Microsoft Azure और Microsoft क्लाउड का परिचय | इस गाइड के दौरान, आप जानेंगे कि क्लाउड कंप्यूटिंग क्या है और Microsoft Azure आपको क्लाउड से अपना व्यवसाय चलाने और चलाने में कैसे मदद कर सकता है।

Techopedia डीप Q-Networks की व्याख्या करता है

उच्च स्तर की संवेदी इनपुट से नीतियों को सीखने के लिए डी क्यू सीखने की विधि आम तौर पर सामान्य नीति पुनरावृत्ति नामक कुछ का उपयोग करती है, जिसे नीति मूल्यांकन और नीति पुनरावृत्ति के संयोजन के रूप में वर्णित किया जाता है।

उदाहरण के लिए, तकनीक जैसे प्रकाशनों में शामिल एक सामान्य प्रकार का गहन क्यू नेटवर्क, मध्यम परिणामों के लिए अटारी 2600 वीडियो गेम से संवेदी इनपुट लेता है। यह नमूनों को इकट्ठा करके, उन्हें संग्रहीत करके और क्यू नेटवर्क को अपडेट करने के लिए अनुभव पुनरावृत्ति के लिए उनका उपयोग करके एक बहुत ही मौलिक स्तर पर किया जाता है।

एक सामान्य अर्थ में, गहन क्यू नेटवर्क इनपुट पर प्रशिक्षित होते हैं जो क्षेत्रों या अन्य अनुभवी नमूनों में सक्रिय खिलाड़ियों का प्रतिनिधित्व करते हैं और वांछित आउटपुट के साथ उन डेटा से मेल खाना सीखते हैं। यह आर्टिफिशियल इंटेलिजेंस के विकास में एक शक्तिशाली तरीका है जो उच्च स्तर पर शतरंज जैसे खेल खेल सकता है, या अन्य उच्च-स्तरीय संज्ञानात्मक गतिविधियों को अंजाम दे सकता है - अटारी या शतरंज वीडियो गेम खेलने का उदाहरण भी एआई का उपयोग करने का एक अच्छा उदाहरण है। ऐसे प्रकार के इंटरफेस जो पारंपरिक रूप से मानव एजेंटों द्वारा उपयोग किए जाते थे।

दूसरे शब्दों में, गहन क्यू लर्निंग के साथ, एआई खिलाड़ी वांछित परिणाम प्राप्त करने के लिए सीखने में एक मानव खिलाड़ी की तरह अधिक हो जाता है।