डीप क्यू-नेटवर्क

लेखक: Laura McKinney
निर्माण की तारीख: 5 अप्रैल 2021
डेट अपडेट करें: 26 जून 2024
Anonim
Deep Q-Learning - Combining Neural Networks and Reinforcement Learning
वीडियो: Deep Q-Learning - Combining Neural Networks and Reinforcement Learning

विषय

परिभाषा - डीप क्यू-नेटवर्क्स का क्या अर्थ है?

डीप क्यू नेटवर्क्स (DQN) तंत्रिका नेटवर्क (और / या संबंधित उपकरण) हैं जो बुद्धिमान क्यू वीडियो गेम खेलने के सिमुलेशन के रूप में मॉडल प्रदान करने के लिए गहन क्यू लर्निंग का उपयोग करते हैं। एक विशिष्ट न्यूरल नेटवर्क बिल्ड के लिए एक विशिष्ट नाम होने के बजाय, डी क्यू नेटवर्क नेटवर्क और अन्य संरचनाओं से बना हो सकता है जो विभिन्न प्रक्रियाओं के बारे में जानने के लिए विशिष्ट तरीकों का उपयोग करते हैं।


Microsoft Azure और Microsoft क्लाउड का परिचय | इस गाइड के दौरान, आप जानेंगे कि क्लाउड कंप्यूटिंग क्या है और Microsoft Azure आपको क्लाउड से अपना व्यवसाय चलाने और चलाने में कैसे मदद कर सकता है।

Techopedia डीप Q-Networks की व्याख्या करता है

उच्च स्तर की संवेदी इनपुट से नीतियों को सीखने के लिए डी क्यू सीखने की विधि आम तौर पर सामान्य नीति पुनरावृत्ति नामक कुछ का उपयोग करती है, जिसे नीति मूल्यांकन और नीति पुनरावृत्ति के संयोजन के रूप में वर्णित किया जाता है।

उदाहरण के लिए, तकनीक जैसे प्रकाशनों में शामिल एक सामान्य प्रकार का गहन क्यू नेटवर्क, मध्यम परिणामों के लिए अटारी 2600 वीडियो गेम से संवेदी इनपुट लेता है। यह नमूनों को इकट्ठा करके, उन्हें संग्रहीत करके और क्यू नेटवर्क को अपडेट करने के लिए अनुभव पुनरावृत्ति के लिए उनका उपयोग करके एक बहुत ही मौलिक स्तर पर किया जाता है।

एक सामान्य अर्थ में, गहन क्यू नेटवर्क इनपुट पर प्रशिक्षित होते हैं जो क्षेत्रों या अन्य अनुभवी नमूनों में सक्रिय खिलाड़ियों का प्रतिनिधित्व करते हैं और वांछित आउटपुट के साथ उन डेटा से मेल खाना सीखते हैं। यह आर्टिफिशियल इंटेलिजेंस के विकास में एक शक्तिशाली तरीका है जो उच्च स्तर पर शतरंज जैसे खेल खेल सकता है, या अन्य उच्च-स्तरीय संज्ञानात्मक गतिविधियों को अंजाम दे सकता है - अटारी या शतरंज वीडियो गेम खेलने का उदाहरण भी एआई का उपयोग करने का एक अच्छा उदाहरण है। ऐसे प्रकार के इंटरफेस जो पारंपरिक रूप से मानव एजेंटों द्वारा उपयोग किए जाते थे।


दूसरे शब्दों में, गहन क्यू लर्निंग के साथ, एआई खिलाड़ी वांछित परिणाम प्राप्त करने के लिए सीखने में एक मानव खिलाड़ी की तरह अधिक हो जाता है।