सुदृढीकरण सीखना

विषय

परिभाषा - सुदृढीकरण सीखने का क्या अर्थ है?
Microsoft Azure और Microsoft क्लाउड का परिचय | इस गाइड के दौरान, आप जानेंगे कि क्लाउड कंप्यूटिंग क्या है और Microsoft Azure आपको क्लाउड से अपना व्यवसाय चलाने और चलाने में कैसे मदद कर सकता है।
टेकोपेडिया रीइनफोर्समेंट लर्निंग बताते हैं

परिभाषा - सुदृढीकरण सीखने का क्या अर्थ है?

आर्टिफिशियल इंटेलिजेंस के संदर्भ में, सुदृढीकरण सीखने, एक प्रकार की गतिशील प्रोग्रामिंग है जो एल्गोरिदम को इनाम और दंड की प्रणाली का उपयोग करके प्रशिक्षित करती है।

एक सुदृढीकरण सीखने का एल्गोरिथ्म, या एजेंट, अपने पर्यावरण के साथ बातचीत करके सीखता है। एजेंट सही ढंग से प्रदर्शन करके पुरस्कार प्राप्त करता है और गलत तरीके से प्रदर्शन करने के लिए दंड देता है। एजेंट अपने इनाम को अधिकतम करने और जुर्माना को कम करके मानव से हस्तक्षेप के बिना सीखता है।

Microsoft Azure और Microsoft क्लाउड का परिचय | इस गाइड के दौरान, आप जानेंगे कि क्लाउड कंप्यूटिंग क्या है और Microsoft Azure आपको क्लाउड से अपना व्यवसाय चलाने और चलाने में कैसे मदद कर सकता है।

टेकोपेडिया रीइनफोर्समेंट लर्निंग बताते हैं

सुदृढीकरण सीखना मशीन सीखने के लिए एक दृष्टिकोण है जो व्यवहारवादी मनोविज्ञान से प्रेरित है। यह उसी तरह है जैसे कोई बच्चा नया कार्य करना सीखता है। सुदृढीकरण सीखने के अन्य मशीन सीखने के दृष्टिकोण के साथ विरोधाभास है कि एल्गोरिथ्म को स्पष्ट रूप से नहीं बताया गया है कि किसी कार्य को कैसे करना है, लेकिन अपने आप समस्या के माध्यम से काम करता है।

एक एजेंट के रूप में, जो सेल्फ-ड्राइविंग कार या शतरंज खेलने वाला कार्यक्रम हो सकता है, अपने वातावरण के साथ बातचीत करता है, यह कैसे प्रदर्शन करता है, इस आधार पर एक इनाम राज्य प्राप्त करता है, जैसे कि सुरक्षित रूप से गंतव्य पर ड्राइविंग करना या गेम जीतना। इसके विपरीत, एजेंट को गलत तरीके से प्रदर्शन करने के लिए दंड मिलता है, जैसे कि सड़क से दूर जाना या चेक किया जाना।

समय के साथ एजेंट अपने इनाम को अधिकतम करने और गतिशील प्रोग्रामिंग का उपयोग करके अपने दंड को कम करने के लिए निर्णय लेता है। कृत्रिम बुद्धिमत्ता के लिए इस दृष्टिकोण का लाभ यह है कि यह एक AI प्रोग्रामर को प्रोग्रामर के बिना सीखने की अनुमति देता है कि कैसे एक एजेंट को कार्य करना चाहिए।