मार्कोव निर्णय प्रक्रिया (एमडीपी)

लेखक: Laura McKinney
निर्माण की तारीख: 5 अप्रैल 2021
डेट अपडेट करें: 22 जून 2024
Anonim
Markov Decision Process (MDP) Tutorial
वीडियो: Markov Decision Process (MDP) Tutorial

विषय

परिभाषा - मार्कोव निर्णय प्रक्रिया (एमडीपी) का क्या अर्थ है?

मार्कोव निर्णय प्रक्रिया (एमडीपी) एक ऐसी चीज है जो पेशेवरों को "असतत समय स्टोकेस्टिक नियंत्रण प्रक्रिया" के रूप में संदर्भित करती है। यह 19 वीं सदी के अंत और 20 वीं शताब्दी की शुरुआत में रूसी शैक्षणिक एंड्री मार्कोव द्वारा अग्रणी गणित पर आधारित है।


Microsoft Azure और Microsoft क्लाउड का परिचय | इस गाइड के दौरान, आप जानेंगे कि क्लाउड कंप्यूटिंग क्या है और Microsoft Azure आपको क्लाउड से अपना व्यवसाय चलाने और चलाने में कैसे मदद कर सकता है।

Techopedia मार्कोव निर्णय प्रक्रिया (MDP) की व्याख्या करता है

मार्कोव निर्णय प्रक्रिया और संबद्ध मार्कोव श्रृंखलाओं को समझाने का एक तरीका यह है कि ये आधुनिक खेल सिद्धांत के तत्व हैं जो कुछ सौ साल पहले रूसी वैज्ञानिक द्वारा सरल गणितीय अनुसंधान पर आधारित थे। मार्कोव निर्णय प्रक्रिया का वर्णन यह है कि यह एक परिदृश्य का अध्ययन करता है जहां एक प्रणाली कुछ दिए गए राज्यों में होती है, और एक निर्णय निर्माता के निर्णयों के आधार पर दूसरे राज्य में आगे बढ़ती है।

एक मॉडल के रूप में एक मार्कोव श्रृंखला उन घटनाओं के अनुक्रम को दिखाती है जहां किसी दिए गए घटना की संभावना पहले से प्राप्त स्थिति पर निर्भर करती है। मार्कोव निर्णय प्रक्रिया का वर्णन करने के लिए पेशेवर “काउंटेबल स्टेट स्पेस” के बारे में बात कर सकते हैं - कुछ “मार्मिक वॉक मॉडल” के विचार को “बेतरतीब वॉक” मॉडल या अन्य स्टोकेस्टिक मॉडल के साथ संभावनाओं पर आधारित (अक्सर रैंडम वॉक मॉडल) के रूप में उद्धृत किया जाता है। स्ट्रीट, एक बाजार संभावना संभावना में ऊपर या नीचे एक इक्विटी के आंदोलन को मॉडल करता है)।


सामान्य तौर पर, मार्कोव निर्णय प्रक्रियाओं को अक्सर कुछ सबसे परिष्कृत तकनीकों पर लागू किया जाता है जो आज के पेशेवरों पर काम कर रहे हैं, उदाहरण के लिए, रोबोटिक्स, स्वचालन और अनुसंधान मॉडल में।