सुदृढीकरण सीखना विपणन को एक अच्छा गतिशील स्पिन दे सकता है

लेखक: Roger Morrison
निर्माण की तारीख: 1 सितंबर 2021
डेट अपडेट करें: 1 जुलाई 2024
Anonim
डायना और डैड ने कैंडी सैलून खेलने का नाटक किया
वीडियो: डायना और डैड ने कैंडी सैलून खेलने का नाटक किया

विषय



स्रोत: Juliatimchenko / Dreamstime.com

ले जाओ:

सुदृढीकरण सीखना कृत्रिम बुद्धि और मशीन सीखने का एक सबसेट है जो परिणामों की भविष्यवाणी कर सकता है और उपयोगकर्ताओं को बेहतर निर्णय लेने में मदद कर सकता है।

तेजी से प्रतिस्पर्धी विपणन स्थितियों में बढ़त हासिल करने की कोशिश करते हुए मार्केटर्स लगातार स्केलेबल और बुद्धिमान समाधान तलाश रहे हैं। यह कोई आश्चर्य की बात नहीं है कि कृत्रिम बुद्धिमत्ता (एआई) और मशीन लर्निंग (एमएल) को अब ब्रांडों और उनके विपणन संगठनों द्वारा अपनाया जा रहा है। (एमएल की मूल बातें पर अधिक जानने के लिए, मशीन लर्निंग 101 देखें।)

बिना किसी सूचना के, एआई को आमतौर पर एक प्रौद्योगिकी के रूप में माना जा सकता है जब कंप्यूटर परिभाषित कार्यों को स्वचालित करता है जो एक मानव अन्यथा करता है। मशीन लर्निंग, एआई के भीतर एक कार्यात्मक क्षेत्र के रूप में है, जब कंप्यूटर को एक अंतिम लक्ष्य दिया जाता है, लेकिन इसके लिए सबसे अच्छा मार्ग की गणना करने की आवश्यकता होती है।

आज, हम इन तकनीकों को देख रहे हैं - विशेष रूप से मशीन लर्निंग - मार्केटिंग के कई क्षेत्रों में तैनात हैं, जिसमें विज्ञापन धोखाधड़ी का पता लगाना, उपभोक्ता व्यवहार का पूर्वानुमान, सिफारिश प्रणाली, रचनात्मक निजीकरण और बहुत कुछ शामिल है।


हालांकि, यह सब अच्छी तरह से और अच्छा है, वहाँ एक नई तकनीक है, जो विपणक के लिए, वास्तव में उस मांग पर वितरित करने जा रही है जो मशीन लर्निंग बना रही है। इसे "सुदृढीकरण सीखने" (RL) कहा जाता है।

सुदृढीकरण सीखना क्या है?

ML से RL में परिवर्तन केवल एक पत्र से अधिक है। अधिकांश कार्यों को मशीन लर्निंग में एक ही चरण का उपयोग करके शामिल किया गया है, जैसे कि "इस छवि को पहचानें," "पुस्तक की सामग्री को समझें" या "धोखाधड़ी को पकड़ें।" एक बाज़ारिया के लिए, "जैसे उपयोगकर्ताओं को आकर्षित, बनाए रखना और संलग्न करना" जैसे व्यवसाय लक्ष्य। स्वाभाविक रूप से एक बहु-चरण और दीर्घकालिक एक, आसानी से मशीन सीखने के साथ हासिल नहीं किया गया।

यह वह जगह है जहां सुदृढीकरण सीखने की बात आती है। आरएल एल्गोरिदम एक खुलासा और कभी-बदलती यात्रा के लिए अनुकूलन के बारे में हैं - एक जहां गतिशील परिवर्तन होते हैं। प्रत्येक क्रमपरिवर्तन के परिणाम की गणना करने के लिए गणितीय "रिवॉर्ड फंक्शन" को नियोजित करके, आरएल भविष्य में देख सकता है और सही कॉल कर सकता है।


आज इस अत्याधुनिक तकनीक के बेहतरीन अवतार गेम और सेल्फ ड्राइविंग कारों में देखे जा सकते हैं। जब पिछले साल Google के AlphaGo सिस्टम ने बोर्ड गेम गो के विश्व के सर्वश्रेष्ठ खिलाड़ी को हराया था, तो उनकी गुप्त चटनी सुदृढीकरण सीखने की थी। जब भी गेम में नियम होते हैं, बोर्ड की स्थिति के आधार पर जीत की ओर एक खिलाड़ी के विकल्प गतिशील रूप से बदल जाते हैं। सुदृढीकरण सीखने के साथ, सिस्टम हर संभव क्रमपरिवर्तन के लिए खाता है जो प्रत्येक अगले कदम के आधार पर बदल सकता है।

इसी तरह, एक सेल्फ-ड्राइविंग कार एक यात्रा पर जाती है जिसमें सड़क के नियमों और गंतव्य के स्थान को तय किया जाता है, लेकिन रास्ते में चर - पैदल चलने वालों से सड़क के ब्लॉक से साइकिल चालकों तक - गतिशील रूप से बदलते हैं। यही कारण है कि टेस्ला के एलोन मस्क द्वारा स्थापित संगठन OpenAI, अपने वाहनों के लिए उन्नत आरएल एल्गोरिदम नियुक्त करता है।

नो बग्स, नो स्ट्रेस - योर स्टेप बाय स्टेप गाइड बाय स्टेप गाइड टू लाइफ-चेंजिंग सॉफ्टवेर विदाउट योर लाइफ


जब कोई भी सॉफ़्टवेयर गुणवत्ता की परवाह नहीं करता है तो आप अपने प्रोग्रामिंग कौशल में सुधार कर सकते हैं।

विपणक के लिए मशीनें

विपणक के लिए इसका क्या मतलब है?

कई विपणक की मुख्य चुनौतियां इस तथ्य से बनती हैं कि व्यवसाय की स्थिति हर समय बदलती रहती है। एक जीत अभियान की रणनीति समय के साथ प्रतिकूल हो सकती है, जबकि एक पुरानी रणनीति नए कर्षण प्राप्त कर सकती है। आरएल सच्ची मानव बुद्धि की नकल करने की दिशा में एक कदम है जहां हम कई परिणामों की सफलता और / या विफलता से सीखते हैं, और भविष्य की जीत की रणनीति बनाते हैं। मुझे कुछ उदाहरण दें:

1. उपयोगकर्ता की व्यस्तता में वृद्धि

एक रेस्तरां श्रृंखला के लिए ग्राहक जुड़ाव पर ध्यान दें, और अगले वर्ष में इसे दस गुना करने का लक्ष्य रखें। आज, एक मार्केटिंग अभियान में छूट की पेशकश के साथ जन्मदिन की शुभकामनाएं शामिल हो सकती हैं, शायद खाद्य वरीयताओं के आधार पर भी। यह रैखिक सोच है जहां बाजार ने एक शुरुआत और अंत बिंदु को परिभाषित किया है।

व्यस्त दुनिया में, ग्राहकों का जीवन लगातार वास्तविक समय में बदल रहा है - कभी-कभी वे अधिक व्यस्त होते हैं, कभी-कभी कम होते हैं। सुदृढीकरण सीखने में, एक प्रणाली लगातार पुनर्गणना करती रहेगी जो किसी भी समय विपणन शस्त्रागार में रणनीति बनाती है, प्राप्तकर्ता को 10x सगाई के अंतिम लक्ष्य की ओर ले जाने का सबसे अच्छा मौका है।

2. डायनेमिक बजट आवंटन

अब एक ऐसे विज्ञापन परिदृश्य की कल्पना करें, जिसमें आपके पास $ 1 मिलियन का बजट है और महीने के अंत तक हर दिन कुछ खर्च करने की आवश्यकता है, जो चार अलग-अलग चैनलों में आवंटित किए गए हैं: टीवी, वफादारी पदोन्नति, और Google। आप यह सुनिश्चित कर सकते हैं कि आप सबसे इष्टतम तरीके से बजट कैसे खर्च करेंगे? उत्तर दिन, लक्ष्य उपयोगकर्ताओं, सूची मूल्य और अन्य कारकों के एक मेजबान पर निर्भर करता है।

सुदृढीकरण सीखने में, एल्गोरिदम इनाम कार्यों को लिखने के लिए ऐतिहासिक विज्ञापन परिणाम डेटा का उपयोग करेंगे जो कुछ निश्चित खर्च निर्णय लेते हैं। लेकिन यह मूल्य निर्धारण जैसे वास्तविक समय के कारकों और लक्षित दर्शकों के सदस्य से सकारात्मक स्वागत की संभावना के लिए भी जिम्मेदार है। पुनरावृति सीखने के माध्यम से, पूरे महीने विज्ञापन खर्च का आवंटन गतिशील रूप से बदल जाएगा। हालांकि अंतिम लक्ष्य निर्धारित किया गया है, आरएल ने सभी परिदृश्यों के माध्यम से सर्वोत्तम तरीके से बजट आवंटित किया है। (मार्केटिंग में AI पर अधिक जानकारी के लिए, देखें कि आर्टिफिशियल इंटेलिजेंस कैसे सेल्स इंडस्ट्री में क्रांति लाएगा।)

जल्द आ रहा है

सुदृढीकरण सीखने की जटिलता को स्वीकार करता है और मानता है कि लोग विषम हैं और इन सच्चाइयों के लिए खाते हैं, समय के साथ प्रत्येक अगली कार्रवाई में सुधार होता है क्योंकि आपके गेम बोर्ड के टुकड़े इसके चारों ओर बदलते हैं।

सुदृढीकरण सीखना अभी भी काफी हद तक अनुसंधान परियोजनाओं और अग्रणी-दत्तक ग्रहणकर्ताओं का संरक्षण है। गणित की अवधारणा और तकनीक लगभग 40 वर्षों से अधिक समय से है, लेकिन अपेक्षाकृत हाल तक तैनाती के लिए संभव नहीं है, तीन रुझानों के लिए धन्यवाद:

  1. उच्च शक्ति वाले ग्राफिक्स प्रसंस्करण इकाइयों (GPUs) के माध्यम से कंप्यूटिंग शक्ति का प्रसार।

  2. क्लाउड कंप्यूटिंग उच्च-स्तरीय प्रोसेसर शक्ति को स्वयं GPU खरीदने की लागत के एक अंश पर उपलब्ध कराती है, जिससे तीसरे पक्ष को अपेक्षाकृत सस्ते-बेसमेंट मूल्य पर कई घंटे, दिनों या हफ्तों के लिए अपने RL मॉडल को प्रशिक्षित करने के लिए GPU किराए पर लेने की अनुमति मिलती है।

  3. संख्यात्मक एल्गोरिदम या स्मार्ट ह्यूरिस्टिक्स में सुधार। एक आरएल एल्गोरिथ्म में कुछ महत्वपूर्ण संख्यात्मक चरण अब बहुत तेज गति से परिवर्तित करने में सक्षम हैं। इन जादुई संख्यात्मक ट्रिक्स के बिना, वे अभी भी सबसे शक्तिशाली कंप्यूटर के साथ भी संभव नहीं होंगे।

सोच बड़ा

इसका मतलब यह है कि सुदृढीकरण सीखने की नई शक्तियां जल्द ही ब्रांड और मार्केटर्स के पैमाने पर उपलब्ध होने वाली हैं। हालांकि, इसे गले लगाने से मानसिकता में बदलाव की आवश्यकता है। एक विपणन प्रबंधक के लिए, इस तकनीक का मतलब है कि वे अपने हाथों को पहिया से दूर ले जा सकते हैं।

प्रत्येक व्यवसाय का एक लक्ष्य होता है, लेकिन जब आप खाइयों में गहरे होते हैं, तो उस लक्ष्य की ओर की जाने वाली दैनिक क्रियाएं फ़र्ज़ी बन सकती हैं। अब आरएल प्रौद्योगिकी निर्णय लेने वालों को लक्ष्य निर्धारित करने की अनुमति देगा, और अधिक आत्मविश्वास होने पर कि सिस्टम इसके लिए अपने सर्वोत्तम पाठ्यक्रम की साजिश करेगा।

उदाहरण के लिए, इन दिनों, कई लोगों को यह पता चलता है कि क्लिक-थ्रू दर (CTR) जैसे मैट्रिक्स सही व्यवसाय के परिणामों के लिए केवल अनुमानित हैं, केवल इसलिए गिने जाते हैं क्योंकि वे गणना योग्य हैं। आरएल-चालित विपणन प्रणाली ऐसे मध्यस्थ मेट्रिक्स और उन सभी भारी उठाने पर जोर देगी जो मालिकों को उद्देश्यों पर ध्यान केंद्रित करने की अनुमति देते हैं।

इससे व्यवसायों को अपनी बड़ी समस्याओं के बारे में बहुत अधिक सक्रिय और दीर्घकालिक तरीके से सोचने की आवश्यकता होगी। जब तकनीक परिपक्व होगी, तो वे अपने लक्ष्य को प्राप्त कर लेंगे।

अपनाने का रास्ता

सुदृढीकरण सीखना अभी तक ब्रांडों द्वारा पूर्ण पैमाने पर उपयोग के लिए तैयार नहीं है; हालाँकि, मार्केटर्स को इस नए कॉन्सेप्ट को समझने में समय लगाना चाहिए, जिससे ब्रांड मार्केटिंग करने के तरीके में क्रांतिकारी बदलाव ला सके, जिससे मशीन लर्निंग के कुछ शुरुआती वादों पर अच्छा असर पड़े।

जब बिजली आती है, तो यह यूजर इंटरफेस के साथ मार्केटिंग सॉफ्टवेयर में आएगा, लेकिन उस सॉफ्टवेयर के लिए आवश्यक कार्यों को मूल रूप से सरल बनाया जाएगा। कर्मचारियों के लिए, कम मूविंग स्विच और इनपुटिंग नंबर होंगे, साथ ही कम एनालिटिक्स रिपोर्ट पढ़ना और उन पर अभिनय करना भी होगा। डैशबोर्ड के पीछे, एल्गोरिथ्म सबसे अधिक संभाल रहा होगा।

यह संभावना नहीं है कि आरएल गेट से बाहर मानव बुद्धि का मिलान कर सकता है। इसके विकास की गति विपणक की प्रतिक्रिया और सुझावों पर निर्भर करेगी। हमें यह सुनिश्चित करना चाहिए कि हम एक कंप्यूटर को सही समस्या को हल करने के लिए कह रहे हैं, और जब ऐसा नहीं होता है तो इसे दंडित करते हैं। लगता है कि आप अपने बच्चे को कैसे सिखाएंगे, क्या यह नहीं है?