हर जगह विश्लेषण एम्बेड करें: नागरिक डेटा वैज्ञानिक को सक्षम करना

लेखक: Lewis Jackson
निर्माण की तारीख: 12 मई 2021
डेट अपडेट करें: 20 जून 2024
Anonim
High Density 2022
वीडियो: High Density 2022

ले जाओ: होस्ट रेबेका जोजवियाक डॉ। रॉबिन ब्लोर, डीज़ ब्लांचफील्ड और डेविड स्नीनर के साथ एम्बेडेड एनालिटिक्स और नागरिक डेटा वैज्ञानिकों की घटना पर चर्चा करते हैं।



वीडियो देखने के लिए आपको इस घटना के लिए पंजीकरण करना होगा। वीडियो देखने के लिए रजिस्टर करें।

रेबेका जोजवाक: देवियों और सज्जनों, नमस्ते और हॉट टेक्नोलॉजीज में आपका स्वागत है। "हर जगह एम्बेड करें: नागरिक डेटा वैज्ञानिक को सक्षम करना" आज हमारा विषय है। मैं आपके सामान्य मेजबान के लिए भर रहा हूं, यह रेबेका जोजवाक एरिक कवनघ के लिए भरना है। जी हां, यह साल गर्म है। विशेष रूप से शब्द "डेटा वैज्ञानिक" पर बहुत अधिक ध्यान दिया जा रहा है, भले ही हम उन्हें "सांख्यिकीविद्" या "एनालिटिक्स विशेषज्ञ" जैसे उबाऊ नामों से पुकारते थे, लेकिन एक ही प्रकार की गतिविधियों से बहुत अधिक निपटते हैं, लेकिन यह एक सेक्सी नया नाम है। बहुत ध्यान आकर्षित करना। वे कार्यस्थल में संगठन के लिए फायदेमंद होने के लिए अत्यधिक वांछनीय हैं, और हर कोई एक चाहता है। लेकिन वे हैं: 1) महंगा, 2) खोजने के लिए मुश्किल। आप जानते हैं, यह डेटा वैज्ञानिक कौशल की कमी के बारे में सभी समाचारों पर है, हाँ, लेकिन फिर भी वे संगठन को जबरदस्त मूल्य प्रदान करते हैं और लोग यह जानने के लिए तरह-तरह के कटाक्ष कर रहे हैं कि कैसे उस मूल्य को पाने के लिए बिना डाइम को गिराए, ताकि बोले।


लेकिन अच्छी खबर यह है कि हम ऐसे उपकरणों और सॉफ्टवेयरों को देख रहे हैं जो उस कमी की भरपाई कर रहे हैं। हमारे पास ऑटोमेशन, मशीन लर्निंग, एंबेडेड एनालिटिक्स है, जो कि हम आज के बारे में सीख रहे हैं, और यह इस नए शब्द, "नागरिक डेटा वैज्ञानिक," और इस तरह का अर्थ क्या है? नहीं, यह आपके प्रशिक्षित डेटा वैज्ञानिक नहीं हैं, यह आपका व्यवसाय उपयोगकर्ता, आपका बीआई विशेषज्ञ, आईटी का कोई व्यक्ति हो सकता है, जिसके पास कोई पृष्ठभूमि हो, लेकिन हो सकता है कि यह जरूरी नहीं कि विशेषज्ञता हो।लेकिन यह क्या करता है, इन उपकरणों और सॉफ्टवेयर, क्या यह अधिक लोगों को उन स्मार्ट समाधानों तक पहुंच प्रदान करता है, भले ही वे गहरी कोडिंग को नहीं जानते हों। लेकिन यह केवल समग्र प्रदर्शन को बेहतर बनाने में मदद करता है जब आप सभी को उस विश्लेषणात्मक विचार तक थोड़ी अधिक पहुंच प्रदान करते हैं। आपके पास आवश्यक जिज्ञासा के प्रकार के लिए प्रशिक्षण होना आवश्यक नहीं है जिससे आपकी कंपनी के लिए अच्छी जानकारी प्राप्त हो सके।

चर्चा करते हुए कि आज हमारे साथ रॉबोर ग्रुप के मुख्य विश्लेषक रॉबिन ब्लोर हैं, जो स्वयं मायावी डेटा वैज्ञानिकों में से एक हैं, डीज़ ब्लैंचफील्ड को बुलाते हैं, और फिर हमारे पास डेल स्टेटिस्टिका के डेविड स्नीडर हैं जो आज हमें एक प्रस्तुति देंगे। और इसके साथ ही मैं इसे रॉबिन ब्लोर को सौंपने जा रहा हूं।


रॉबिन बोर: ठीक है, उस परिचय के लिए धन्यवाद। मैं एक ऐतिहासिक शंख में इस बारे में सोचा था। वास्तव में हम यहां जो देख रहे हैं वह लियोनार्डो दा विंची के डिजाइन के लिए एक तरह का ग्लाइडर है जो एक आदमी अपनी पीठ पर रख सकता है। मुझे नहीं पता कि क्या यह वास्तव में काम करेगा। मैं इसमें नहीं जाऊंगा, मुझे कहना होगा हालांकि, दा विंची, जब भी मैं दा विंची के बारे में सोचता हूं, मैं उसे सबसे जिज्ञासु और विश्लेषणात्मक लोगों में से एक के रूप में सोचता हूं जो कभी भी अस्तित्व में था। और यह बिल्कुल स्पष्ट है अगर आप सिर्फ उस ग्लाइडर को देखते हैं जो इसे एक पक्षी के पंख के आधार पर बनाया गया है और उसने इसे बनाने के लिए पक्षियों की उड़ानों का एक तरह से अध्ययन किया है।

यदि हम ऐतिहासिक परिप्रेक्ष्य लेते हैं - मैंने वास्तव में इसे देखा - विश्लेषिकी शायद गणित का सबसे पुराना अनुप्रयोग है। ऐसे सेंसर हैं जो कम से कम बेबीलोनियन समय के हैं। हम इसके बारे में जानते हैं क्योंकि मूल रूप से कुछ क्यूनिफॉर्म टैबलेट हैं जिनके पास उस तरह का डेटा है। यह ज्ञात नहीं है कि क्या कुछ था जो किसी भी पहले वापस चला गया था। लेकिन स्पष्ट बात यह है कि आप लोगों की एक बड़ी आबादी के साथ अपने आप को एक सभ्यता मिल गई है, यह वास्तव में योजना की आवश्यकता है और यह जानने के लायक है कि आप क्या योजना बना रहे हैं और वास्तव में उन लोगों की क्या आवश्यकताएं हैं।

और यह उस तरह का है जहां यह शुरू हुआ था और यह भी जहां कंप्यूटिंग शुरू हुई थी, क्योंकि शुरुआती कंप्यूटर, प्रारंभिक यांत्रिक कंप्यूटर वास्तव में थे, मुझे लगता है कि होलेरिथ द्वारा बनाई गई पहली जनगणना थी, जो आईबीएम बन गई थी, मुझे विश्वास है। यह सब आगे बढ़ा है। 1970 और वर्तमान के बीच में किसी न किसी तरह का अंतर्कलह रहा है, जहां बड़ी संख्या में अन्य अनुप्रयोग और विश्लेषिकी हैं, आप कह सकते हैं, एक पीछे की सीट ले ली। हां, वहां एनालिटिक्स चल रहा था - यह बड़े संगठनों, विशेष रूप से बैंकों और बीमा कंपनियों, और वास्तव में जनरल इलेक्ट्रिक और टेल्को और इस तरह की चीजों में हो रहा था - लेकिन इसका इस्तेमाल आम तौर पर पूरे व्यापार में नहीं किया गया था और अब यह आम तौर पर इस्तेमाल होने लगा है व्यापार। और इसने वास्तव में खेल को बदल दिया है। सबसे पहले मैंने सोचा था कि मैं डेटा पिरामिड पर ध्यान आकर्षित करता हूं, जो मुझे विशेष रूप से पसंद है। इसका मतलब है, मैंने इन 20 वर्षों में से एक को आकर्षित किया - कम से कम 20 साल पहले - कोशिश करने और समझने के लिए, वास्तव में, उस समय मैं बीआई और कुछ शुरुआती डेटा खनन को समझने की कोशिश कर रहा था। यहाँ जो मैंने परिभाषित किया है वह डेटा का विचार है और उदाहरण सिग्नल, माप, रिकॉर्डिंग, ईवेंट, लेनदेन, गणना, एकत्रीकरण, जानकारी के व्यक्तिगत बिंदु हैं। आप उन्हें जानकारी के अणु के रूप में सोच सकते हैं, लेकिन वे व्यक्तिगत बिंदु हैं। जैसे ही यह con हो जाता है यह जानकारी हो जाती है। लिंक किए गए डेटा, संरचित डेटा, डेटाबेस, डेटा का विज़ुअलाइज़ेशन, प्लॉटर, स्कीमर और ऑन्थोलॉजी - ये सभी जानकारी के रूप में मेरे दिमाग में योग्य होते हैं क्योंकि आपने जो किया है वह बहुत सारी विविधता को एक साथ एकत्रित करता है और डेटा बिंदु से कुछ अधिक बनाता है। कुछ ऐसा जो वास्तव में एक आकार, एक गणितीय आकार है।

ऊपर हमें ज्ञान है। हम जानकारी की जांच कर सकते हैं, हम सीख सकते हैं कि विभिन्न पैटर्न हैं और हम नियमों, नीतियों, दिशानिर्देशों, प्रक्रियाओं को तैयार करके उन पैटर्नों का लाभ उठा सकते हैं और फिर यह ज्ञान का रूप ले लेता है। और बहुत सारे कंप्यूटर प्रोग्राम, जो भी वे कर रहे हैं, एक प्रकार का ज्ञान है, क्योंकि वे डेटा के खिलाफ काम कर रहे हैं और उनके लिए नियम लागू कर रहे हैं। हमारे पास ये तीन परतें हैं और परतों के बीच बढ़ती हुई शोधन है। और इस आरेख के बाईं ओर आपने नए डेटा दर्ज किए हुए दिखाए हैं, इसलिए इनमें से बहुत सी चीजें स्थिर हैं। डेटा जमा हो रहा है, जानकारी जमा हो रही है और ज्ञान संभावित रूप से बढ़ रहा है। शीर्ष पर, हमारे पास "अंडरस्टैंडिंग" है और मैं इसे बनाए रखूंगा, हालांकि यह एक दार्शनिक तर्क है, यह समझ केवल मनुष्य में रहती है। अगर मैं उसके बारे में गलत हूं, तो हम सभी को किसी समय में कंप्यूटर द्वारा बदल दिया जाएगा। लेकिन बहस के बजाय, मैं अगली स्लाइड पर जाऊंगा।

जब मैंने इसे देखा, तो दिलचस्प बात यह है कि यह हाल ही की बात है, दिलचस्प बात यह थी कि यह जानने की कोशिश करें कि वास्तव में एनालिटिक्स क्या था। और अंत में विभिन्न आरेखों को आरेखित करने और इस तरह दिखने वाले एक के साथ समाप्त होने के बाद, मैं इस निष्कर्ष पर पहुंचा, वास्तव में, विश्लेषणात्मक विकास गणितीय सूत्रों के एक भयानक राशि के साथ वास्तव में सिर्फ सॉफ्टवेयर विकास है। विश्लेषणात्मक अन्वेषण इस मायने में सॉफ्टवेयर विकास के लिए थोड़ा अलग है कि आप वास्तव में कई, कई अलग-अलग मॉडल लेंगे और डेटा के बारे में नया ज्ञान उत्पन्न करने के लिए उनकी जांच करेंगे। लेकिन एक बार जब आप इसे उत्पन्न कर लेते हैं, तो यह या तो उस स्थिति में लागू हो जाता है, जो मैं निष्क्रिय निर्णय समर्थन के बारे में सोचता हूं, जो कि उपयोगकर्ता को दी गई जानकारी है; इंटरएक्टिव निर्णय समर्थन, जो ओएलएपी जैसी चीजें हैं, जहां उपयोगकर्ता को डेटा का एक संरचित सेट दिया जाता है, जिसे वे उपलब्ध विभिन्न उपकरणों का उपयोग करके अपने लिए चीजों की जांच और कटौती कर सकते हैं। दृश्य का एक बहुत कुछ ऐसा ही है। और फिर हमारे पास स्वचालन है यदि आप बस कुछ विश्लेषणात्मक अंतर्दृष्टि को बदल सकते हैं जिसे आप उन नियमों के एक समूह में इकट्ठा कर सकते हैं जिन्हें लागू किया जा सकता है, आपको जरूरी नहीं कि एक इंसान को शामिल होना चाहिए। यह उस तरह का तरीका है जैसा मैंने उस समय देखा था जब मैंने वह सब किया था। और तरह-तरह की बातें मुझे होने लगीं। एक बार गतिविधि का एक क्षेत्र, हम कहेंगे, एक बार डेटा का एक डोमेन वास्तव में खनन किया जाता है, अच्छी तरह से खनन किया जाता है, हर संभव दिशा के माध्यम से अच्छी तरह से पता लगाया जाता है, अंततः यह केवल बीआई क्रिस्टलीकृत हो जाता है। जिस आविष्कार का आविष्कार किया गया है वह ज्ञान बनना शुरू हो जाता है जो विभिन्न उपयोगकर्ताओं को विभिन्न तरीकों से सूचित करता है, और उनकी क्षमता को बढ़ाता है, उम्मीद है कि वास्तव में वे जो काम करते हैं, वह करते हैं।

उन चीजों में से एक जो मैंने देखा और मैंने लगभग पाँच वर्षों के लिए भविष्य कहनेवाला विश्लेषिकी को देखा, लेकिन भविष्य कहनेवाला विश्लेषिकी बीआई बन रहा है, इस अर्थ में कि यह सिर्फ लोगों को खिलाने के लिए उपयोगी जानकारी में बदल रहा है और जैसा कि मैंने पहले ही बताया है। वहाँ स्वचालित बीआई रिपोर्टिंग, बीआई खोजपूर्ण, बीआई, इसके बहुत अलग-अलग उन्नयन और भविष्य कहनेवाला विश्लेषण वास्तव में तीनों दिशाओं में जा रहा है। और जैसा कि मैंने बताया कि विश्लेषणात्मक प्रक्रिया सॉफ्टवेयर विकास के लिए अलग नहीं है, बस थोड़ा अलग कौशल वाले विभिन्न लोगों द्वारा किया जाता है। मुझे लगता है कि मुझे इस बात पर जोर देना चाहिए कि वास्तव में एक अच्छा डेटा वैज्ञानिक बनाने के लिए आवश्यक कौशल हासिल करने में वर्षों लगते हैं। वे आसानी से अधिग्रहित नहीं होते हैं और बड़ी संख्या में लोग ऐसा नहीं कर सकते हैं, लेकिन ऐसा इसलिए है क्योंकि इसमें बहुत ही परिष्कृत स्तर पर गणित को समझना शामिल है ताकि यह पता चल सके कि क्या मान्य है और क्या मान्य नहीं है। विश्लेषिकी विकास, नए ज्ञान की खोज, विश्लेषिकी आरोपण, यह ज्ञान को क्रियाशील बनाने के बारे में है। यह उस तरह की पृष्ठभूमि है जिसे मैं पूरे एनालिटिक्स को देखता हूं। यह एक बहुत बड़ा क्षेत्र है और इसके कई, कई आयाम हैं, लेकिन मुझे लगता है कि सामान्यीकरण हर चीज पर लागू होता है।

फिर व्यापार में व्यवधान आ गया है, जैसा कि मैंने उल्लेख किया है कि कई संगठन हैं, दवा कंपनियां एक और हैं, उनके डीएनए में उनके पास एनालिटिक्स हैं। लेकिन ऐसे कई संगठन हैं जो वास्तव में इसे अपने डीएनए में नहीं रखते हैं, और अब उनके पास क्षमता है, अब सॉफ्टवेयर और हार्डवेयर इससे कहीं अधिक सस्ते हैं, जितना अब हुआ करते थे, अब उनके पास इसका फायदा उठाने की क्षमता है। मैं बहुत सी बातें कहूंगा। पहली बात यह है कि एनालिटिक्स कई उदाहरणों में R & D है। आप संगठन के एक विशिष्ट क्षेत्र में सिर्फ विश्लेषिकी लागू कर सकते हैं और यह सांसारिक लग सकता है कि आप एक तरह से या किसी अन्य ग्राहक के आदेश का विश्लेषण कर रहे हैं, फिर भी विभिन्न दृष्टिकोणों से, अन्य डेटा के साथ जुड़कर। लेकिन एनालिटिक्स वास्तव में संगठन को एक पूरे के रूप में देखने की संभावना बनाता है और किसी विशेष गतिविधि का बहुत विश्लेषण करता है जो संगठन और गतिविधियों की पूरी श्रृंखला के भीतर चल रहा है। लेकिन एक बार जब आप वास्तव में उस क्षेत्र में चले जाते हैं, तो मैं इसे बनाए रखना चाहूंगा कि यह अनुसंधान और विकास है। और एक सवाल है कि मुझे एक दो बार पूछा गया है, जो है, "एक कंपनी को एनालिटिक्स पर कितना खर्च करना चाहिए?" और मुझे लगता है कि जवाब देने के बारे में सोचने का सबसे अच्छा तरीका है कि एनालिटिक्स को आरएंडडी के रूप में सोचें। , और बस पूछते हैं, "ठीक है आप व्यवसाय की दक्षता के क्षेत्र में आर एंड डी पर कितना खर्च करेंगे?"

और जो व्यवसाय विश्लेषिकी के साथ नहीं हैं, उनमें बहुत सी चीजें हैं जो वे नहीं जानते हैं। सबसे पहले, वे नहीं जानते कि यह कैसे करना है। आम तौर पर अगर वे वास्तव में संगठन में एक तरह से या किसी अन्य को अपनाते हैं, तो एनालिटिक्स - उनके पास वास्तव में बहुत अधिक विकल्प नहीं होते हैं, लेकिन एक कंसल्टेंसी में जाने के लिए कोई विकल्प नहीं होता है जो उन्हें ऐसा करने में सहायता कर सकता है, क्योंकि यह असंभव या वास्तव में बहुत कठिन होगा व्यवसाय वास्तव में एक डेटा वैज्ञानिक को नियुक्त करते हैं, एक को खोजते हैं, एक को भुगतान करते हैं, और वास्तव में उन पर भरोसा करते हैं कि आप उन्हें क्या करना चाहते हैं। बहुत कठिन। अधिकांश व्यवसाय वास्तव में यह काम करने के लिए कर्मचारियों को काम पर रखने या शिक्षित करने का तरीका नहीं जानते हैं, और इसका कारण यह है कि यह अभी तक उनके डीएनए में नहीं है, इसलिए यह उनकी प्राकृतिक व्यावसायिक प्रक्रियाओं का हिस्सा नहीं है। यह अगले बिंदु में फ़ीड करता है। वे नहीं जानते कि यह कैसे एक व्यवसायिक प्रक्रिया है। इसे करने का सबसे अच्छा तरीका है, दवा कंपनियों और बीमा कंपनियों को कॉपी करना है, बस देखो, और स्वास्थ्य देखभाल केंद्र में कुछ कंपनियां, सिर्फ उस तरीके को देखें जो वे एनालिटिक्स का उपयोग करते हैं और इसे कॉपी करते हैं। क्योंकि यह एक व्यवसायिक प्रक्रिया है। यह नहीं जानते कि यह कैसे पुलिस है या इसे ऑडिट करें। वास्तव में, विशेष रूप से अब यह है कि बहुत सारी सॉफ्टवेयर कंपनियों ने ऐसे उत्पादों का निर्माण किया है जो एक बहुत सारे विश्लेषिकी को स्वचालित करते हैं। ऑडिटिंग के बारे में बात महत्वपूर्ण है, जब आपके पास एक कंसल्टेंसी या साइट पर कोई ऐसा व्यक्ति है जिसे यह समझने के लिए भरोसा किया जा सकता है कि किसी भी विश्लेषणात्मक गणना के परिणाम क्या हैं, यह एक तरह का विकल्प है जिसे आपको बनाना है, लेकिन अगर आप वास्तव में शक्तिशाली विश्लेषणात्मक उपकरण बनाते हैं उन लोगों के हाथ, जो एनालिटिक्स को ठीक से नहीं समझते हैं, वे उन निष्कर्षों पर कूदने की संभावना रखते हैं जो सही नहीं हो सकते हैं। और जैसा कि मैंने कहा, कंपनियों को पता नहीं है कि इसके लिए बजट कैसे बनाया जाए।

ये एनालिटिक्स के फ्लेवर हैं, मैं सिर्फ इनके माध्यम से चलूंगा। सांख्यिकीय विश्लेषण और सांख्यिकीय मॉडलिंग भविष्य कहनेवाला विश्लेषिकी से काफी अलग है, जिनमें से अधिकांश वक्र-फिटिंग हैं। मशीन लर्निंग उन चीजों के लिए अलग है, पथ विश्लेषण और समय श्रृंखला, जो मूल रूप से स्थिति धाराओं पर किया जाता है फिर से अलग हैं। ग्राफ एनालिटिक्स फिर से अलग है, और एनालिटिक्स और अर्थ एनालिटिक्स फिर से अलग हैं। यह सिर्फ इशारा कर रहा है कि यह एक बहुत बहु-शैली की चीज है। ऐसा नहीं है, आप एनालिटिक्स करना शुरू नहीं करते हैं, आप अपनी समस्याओं को देखना शुरू करते हैं और उन विभिन्न उपकरणों और एनालिटिक्स के विभिन्न स्वादों की तलाश करते हैं जो उनके अनुरूप होंगे। और अंत में, शुद्ध नेट। हार्डवेयर और सॉफ्टवेयर विकास के कारण, मेरी राय में एनालिटिक्स अपनी प्रारंभिक अवस्था में है। अभी और भी बहुत कुछ होना बाकी है और आने वाले वर्षों में हम इसे प्रकट करेंगे। मुझे लगता है कि मैं अब डीज़ को गेंद पास कर सकता हूं।

डीज़ ब्लांचफील्ड: हाँ, रॉबिन का पालन करने के लिए एक कठिन कार्य के बारे में बात करें। मैं अपने पसंदीदा कोणों में से इस विषय पर संक्षेप में जाने वाला हूं, जो मानव का कोण है। हमारे रोजमर्रा के जीवन में बहुत सारे बदलाव हो रहे हैं। हमारे दिन-प्रतिदिन के जीवन में सबसे बड़ी बाधाओं में से एक, वर्तमान में मेरे विचार में, सिर्फ रोजमर्रा का काम है। काम करने के लिए काम करना और उस काम को करने की कोशिश करना जिसे आप करने के लिए काम पर रखा गया है, और बढ़ती उम्मीद है कि आप एक रोजमर्रा के व्यक्ति से एक सुपर हीरो तक जा रहे हैं और जानकारी की मात्रा जो संगठनों के आसपास बह रही है और बहुत तेज़ी से निकल रही है, यह एक महत्वपूर्ण चुनौती है और अधिक से अधिक हम लोगों को ज्ञान और सूचना के प्रवाह के साथ प्रयास करने और सामना करने के लिए बेहतर और बेहतर उपकरण प्रदान करने के लिए कर रहे हैं और इसलिए मैंने सोचा कि मैं कोशिश करता हूं और इस पर थोड़ा मजेदार कोण से आता हूं। । लेकिन, यह हमेशा मुझ पर प्रहार करता है कि हमें यह उच्च मन या फ्लैश मॉब और इसके आगे कैसे मिला है, जो हमें विश्लेषणात्मक के रूप में बात करते हैं, लेकिन वास्तव में हम जिस बारे में बात कर रहे हैं, वह लोगों को जानकारी उपलब्ध करा रहा है। उन्हें इसके साथ बातचीत करने की अनुमति दें और इसे इस तरह से करें कि यह स्वाभाविक है और यह सामान्य लगता है।

और वास्तव में, यह मुझे एक छोटे बच्चे, छोटे बच्चे के YouTube वीडियो की याद दिलाता है, जो फर्श पर बैठा है और यह एक आईपैड के साथ खेल रहा है और यह चारों ओर फड़फड़ा रहा है और चुटकी ले रहा है और निचोड़ रहा है और छवियों को बाहर निकाल रहा है और स्क्रीन के साथ खेल रहा है, वहाँ पर डेटा। और फिर माता-पिता iPad को दूर ले जाते हैं और एक पत्रिका, बच्चे की गोद में एक एड पत्रिका डालते हैं। और यह बच्चा शायद दो साल से अधिक पुराना नहीं है। बच्चा पत्रिका की स्क्रीन के साथ प्रयास करना और स्वाइप करना शुरू कर देता है, और चुटकी और निचोड़ लेता है और पत्रिका जवाब नहीं देती है। बच्चा अपनी उंगली ऊपर उठाता है और उसे देखता है और सोचता है, "हम्म, मैं अपनी उंगली का काम नहीं सोचता," और यह खुद को बांह में दबाता है और सोचता है, "आह नहीं, मेरी उंगली का काम मैं अपनी बांह महसूस कर सकता हूं और अच्छा लग रहा है, '' और यह उंगली को दबाता है, और उंगली को पकड़ता है और प्रतिक्रिया करता है। हाँ। तब यह फिर से पत्रिका के साथ बातचीत करने की कोशिश करता है, और इसे कम करके चुटकी बजाता है और निचोड़ता है और स्क्रॉल करता है। फिर वे पत्रिका को दूर ले जाते हैं और iPad को वापस अपनी गोद में रख लेते हैं, और अचानक यह काम करता है। और इसलिए यहाँ एक बच्चा है जो साथ आता है और मनोरंजन के लिए एक विश्लेषणात्मक उपकरण या लाइव स्ट्रीमिंग टूल का उपयोग करने के लिए प्रशिक्षित किया गया है और यह काम नहीं कर सकता है कि पत्रिका कैसे काम करे और पृष्ठों को कैसे फ्लिप करें।

और यह अपने आप में एक दिलचस्प अवधारणा है। लेकिन जब मैं संगठनों के चारों ओर घूमने वाले ज्ञान के बारे में सोचता हूं, और जिस तरह से डेटा बहता है और जिस तरह से लोग व्यवहार करते हैं, मैं अक्सर इस अवधारणा के बारे में सोचता हूं कि लोगों ने फ्लैश मॉब होना क्या सीखा है, जो एक घटना है जहां, और जो सोशल मीडिया बनाता है यह करना और भी आसान है, एक विचार जो इस समय और तिथि और क्रिया पर इस स्थान पर जाता है, या इस वीडियो को देखें और इन नृत्यों को सीखें, या इस रंगीन टोपी को पहनें और एक बजे उत्तर की ओर इशारा करें। और आप अपने नेटवर्क के माध्यम से इसे बाहर निकालते हैं, और हमेशा लोगों का एक पूरा भार, उनमें से सैकड़ों, एक ही स्थान पर एक ही समय में एक ही काम करते हैं और यह वाह कारक है, इस तरह, "पवित्र गाय, कि था वास्तव में प्रभावशाली! ”लेकिन वास्तव में यह वास्तव में एक सरल विचार है, और एक सरल अवधारणा सिर्फ हमारे नेटवर्क के माध्यम से बाहर धकेल दी जाती है और हमें यह परिणाम मिलता है जो एक नेत्रहीन तेजस्वी और श्रव्य रूप से प्रभावशाली चीज है। और जब आप किसी संगठन के बारे में सोचते हैं, तो जिस तरह से हम चाहते हैं कि लोग व्यवहार करें और जिस तरह से हम चाहते हैं कि वे सूचना प्रणाली और ग्राहकों के साथ व्यवहार करें, यह अक्सर इतना आसान होता है, यह एक विचार या एक अवधारणा या एक सांस्कृतिक या व्यवहार विशेषता है जिसे हम पारित करने की कोशिश करते हैं। उपकरण और जानकारी के माध्यम से और सशक्त।

और वह सब जो इस मंत्र है कि मुझे दो और डेढ़ दशक से अधिक समय से है और अगर आपके कर्मचारी को यह पता नहीं चलता कि उन्हें अपना काम करने की आवश्यकता है, तो यह उपकरण हो या जानकारी हो, अनिवार्य रूप से वे पहिए को फिर से मजबूत करेंगे। और इसलिए यह अब एक बढ़ती हुई चुनौती है, जहां हमें बहुत सारी जानकारी और बहुत सारी जानकारी और चीजें बहुत तेज़ी से आगे बढ़ रही हैं, कि हम लोगों को पहिया को रोकने के लिए रोकना चाहते हैं। और जब हम अपने काम के माहौल के बारे में सोचते हैं, तो लोगों के कोण पर वापस आना, जो मेरे पसंदीदा में से एक है, मुझे आश्चर्य हुआ जब हम आश्चर्यचकित थे कि क्यूबिकल्स अच्छे परिणामों के लिए अनुकूल वातावरण नहीं थे, या हमने इस भयावह चीजों की तरह काम किया यहाँ चित्र, और यह ज्यादा नहीं बदला है, बस दीवारों को उतारा है और उन्हें खुले स्थान पर काम करने के लिए बुलाया है। लेकिन बीच में उनके चारों ओर पीले लूप के साथ, ज्ञान का आदान-प्रदान करने वाले दो लोग हैं। और फिर भी, यदि आप बाकी के कमरे को देखते हैं, तो वे सभी वहाँ पर सावधानी से धमाका करते हुए बैठे हैं, जानकारी को एक स्क्रीन में डालते हुए। और अधिक बार नहीं, वास्तव में ज्ञान और डेटा का आदान-प्रदान नहीं, और इसके लिए कई कारण हैं। लेकिन पीले रंग के घेरे में बाईं ओर फर्श के बीच में बातचीत, वहाँ दो लोग दूर बातें कर रहे हैं, ज्ञान गमागमन कर रहे हैं, और शायद कुछ खोजने की कोशिश कर रहे हैं, कहने की कोशिश कर रहे हैं, "क्या आप जानते हैं कि यह रिपोर्ट कहाँ है, जहाँ मैं इस डेटा को पा सकते हैं, इस काम को करने के लिए मैं किस टूल का उपयोग करता हूं? ”और शायद यह काम नहीं किया है इसलिए उन्हें कुछ भी नहीं मिला है, और फर्श पर भटकते हुए, क्यूबिकल ऑफिस स्पेस के नियम को तोड़ दिया है और इसे व्यक्ति में किया है।

और हमारे दफ्तर के आसपास भी ऐसा ही माहौल था, जिसका हम मजाक उड़ाते थे, लेकिन वास्तविकता यह है कि वे काफी शक्तिशाली और प्रभावी हैं। और मेरे पसंदीदा में से एक मोबाइल या फिक्स्ड एनालिटिक्स प्लेटफॉर्म है, जिसे वाटर कूलर कहा जाता है, जहां लोग वहां उठते हैं और वहां पर चिट-चैट करते हैं और ज्ञान की अदला-बदली करते हैं और विचारों की तुलना करते हैं और वाटर कूलर पर खड़े होकर विचारों की अदला-बदली करते हैं। जब आप उनके बारे में सोचते हैं तो वे बहुत शक्तिशाली अवधारणाएँ होती हैं। और अगर आप उन्हें अपने सिस्टम और टूल में अनुवाद कर सकते हैं, तो आपको एक अद्भुत परिणाम मिलेगा। और हमें ऑल-टाइम पसंदीदा मिला, जो अनिवार्य रूप से कार्यालय का सबसे शक्तिशाली डेटा वितरण हब है, अन्यथा रिसेप्शन डेस्क के रूप में जाना जाता है। और अगर आपको कुछ नहीं मिल रहा है, तो आप कहाँ जाते हैं? ठीक है, आप कार्यालय के सामने चलते हैं और आप रिसेप्शन पर जाते हैं और कहते हैं, "क्या आप जानते हैं कि x, y, z कहाँ है?" और मैंने किसी को यह बताने की हिम्मत की कि उन्होंने ऐसा नहीं किया है, जो कम से कम एक बार एक नए में हो नौकरी या एक समय में जब वे सिर्फ कुछ नहीं पा सकते हैं। और आप अपने आप से पूछते हैं, ऐसा क्यों है? यह इंट्रानेट या कुछ उपकरण या जो कुछ भी पर होना चाहिए। इसे ढूंढना आसान होना चाहिए।

और इसलिए जब यह डेटा और एनालिटिक्स और हमारे द्वारा काम करने के लिए हमारे स्टाफ को प्रदान किए गए उपकरण और जिस तरह से मनुष्य नौकरियों के साथ बातचीत करता है, तो मुझे यह विचार मिला है कि हाल ही में एनालिटिक्स टूल और बड़े डेटा प्लेटफ़ॉर्म के उद्भव से पहले , या "डेटा प्रोसेसिंग" के रूप में अच्छी तरह से पुराने स्कूल में इसे कॉल करते हैं, रिपोर्टिंग और ज्ञान साझाकरण गतिशील या सहयोगी या खुले से बहुत दूर था, और जब आप सोचते हैं कि हम किस प्रकार के सिस्टम के बारे में उम्मीद करते हैं कि लोग हमारे साथ काम करते हैं, तो हमारे पास शास्त्रीय, क्या था लोग अब विरासत कहते हैं, लेकिन वास्तविकता यह है कि यह केवल विरासत है जो इस पर है और यह आज भी यहां है, और इसलिए यह वास्तव में विरासत नहीं है। लेकिन पारंपरिक एचआर सिस्टम और ईआरपी सिस्टम - मानव संसाधन प्रबंधन, उद्यम संसाधन नियोजन, उद्यम डेटा प्रबंधन, और ऐसी प्रणालियाँ जिनका उपयोग हम कंपनी चलाने के लिए सूचना का प्रबंधन करने के लिए करते हैं। यह हमेशा के लिए ख़ामोश हो गया।और शीर्ष अंत से, सरल प्लेटफॉर्म जैसे विभागीय इंट्रानेट, संचार करने की कोशिश कर रहे हैं कि चीजें कहां हैं और उन्हें कैसे प्राप्त करें और जगह के आसपास के ज्ञान के साथ कैसे बातचीत करें। हम अपने इंट्रानेट पर पॉप अप करते हैं। यह केवल उन लोगों के रूप में अच्छा है जो समय और प्रयास करते हैं कि इसे वहां डाल दें, अन्यथा यह सिर्फ आपके सिर में रह जाता है। या आपको खाद्य श्रृंखला के निचले भाग में, कॉर्पोरेट SAN और बीच में सब कुछ पर बैठे डेटा मिला है, इसलिए यह स्टोरेज एरिया नेटवर्क फाइलों और डेटा से भरा है, लेकिन कौन जानता है कि इसे कहां खोजना है।

अधिक बार नहीं, हमने इन बंद डेटा प्लेटफ़ॉर्म या बंद सिस्टम का निर्माण किया है, और इसलिए लोगों ने स्थान के चारों ओर जानकारी पास करने के लिए स्प्रैडशीट और पावरपॉइंट्स की पसंद को वापस ले लिया है। लेकिन एक दिलचस्प बात यह थी कि हाल ही में, मेरे दिमाग में, और वह यह था कि मोबाइल डिवाइस और इंटरनेट सामान्य रूप से इस तरह से इस विचार के लिए काम करते हैं कि चीजें वास्तव में बेहतर हो सकती हैं। और मुख्य रूप से उपभोक्ता अंतरिक्ष में। और यह एक दिलचस्प बात है कि रोजमर्रा की जिंदगी में हमारे पास इंटरनेट बैंकिंग जैसी चीजें होने लगीं। हमें उनके साथ बातचीत करने के लिए वास्तव में बैंक नहीं जाना था, हम इसे फोन द्वारा कर सकते थे। मूल रूप से वह क्लूनी था लेकिन तब इंटरनेट इधर-उधर हो गया और हमारे पास एक वेबसाइट थी। आप जानते हैं, और आप वास्तव में कितनी बार हाल ही में अपने बैंक में गए हैं? मैं वास्तव में नहीं कर सकता, दूसरे दिन मुझे इस बारे में बातचीत हुई, और मैं वास्तव में अपने बैंक में जाने के आखिरी समय को याद नहीं कर सका, जिससे मैं काफी सदमे में था, मुझे लगा कि मुझे इसे याद करने में सक्षम होना चाहिए, लेकिन यह बहुत लंबा था पहले मैं वास्तव में याद नहीं कर सकता जब मैं वहाँ गया था। और इसलिए अब हमारे हाथ में ये गैजेट हैं मोबाइल और फोन, टैबलेट और लैपटॉप के रूप में, हमें नेटवर्क और उपकरण और सिस्टम तक पहुंच मिल गई है, और हमने जो उपभोक्ता स्थान सीखा है, वह बेहतर हो सकता है, लेकिन क्योंकि उपभोक्ता स्थान में तेजी से परिवर्तन, जो उद्यम और वातावरण के अंदर अधिक सुस्त और हिमनद परिवर्तन रहा है, हमने हमेशा उस परिवर्तन को दिन-प्रतिदिन के कामकाजी जीवन में नहीं लिया है।

और मुझे इस तथ्य पर मज़ाक उड़ाना पसंद है कि आप हार्डकॉपी के लिए लाइव स्ट्रीम डेटा नहीं कर सकते। इस चित्र में यहाँ एक व्यक्ति है जो कुछ विश्लेषणों को देख रहा है, और यह एक सुंदर ग्राफ है, जो किसी ऐसे व्यक्ति द्वारा निर्मित किया गया है, जो संभवत: एक सांख्यिकीविद या एक एक्ट्रेसेज़ के रूप में बहुत अधिक पैसा चुका रहा है, और वे वहीं बैठे हैं जो करने की कोशिश कर रहे हैं एक हार्डकॉपी पर विश्लेषण और उस पर प्रहार। लेकिन यहाँ मेरे लिए भयावह बात है: इस बैठक कक्ष में ये लोग, उदाहरण के लिए, और मैं इसका उपयोग एक उदाहरण के रूप में करूँगा, वे डेटा के साथ बातचीत कर रहे हैं जो अब ऐतिहासिक है। और यह तब से पुराना है जब उस चीज का उत्पादन किया गया था और फिर एड किया गया था, इसलिए शायद यह एक सप्ताह पुरानी रिपोर्ट हो। अब वे इतना बुरा डेटा नहीं बल्कि पुराने डेटा पर निर्णय ले रहे हैं, जो कि हमेशा के लिए बुरा डेटा हो सकता है। वे आज उस ऐतिहासिक चीज़ के आधार पर निर्णय ले रहे हैं, जो वास्तव में एक बुरी जगह है। हम उस हार्डकॉपी को टैबलेट और फोन की पसंद से बदलने में कामयाब रहे क्योंकि हमने उपभोक्ता स्थान में बहुत तेज़ी से काम किया है, और अब हमने इसे एंटरप्राइज़ स्पेस में काम किया है, वास्तविक समय अंतर्दृष्टि वास्तविक समय मूल्य है।

और हम उस पर बेहतर और बेहतर हो रहे हैं। और यह मुझे उस बिंदु पर लाता है जो रॉबिन ने पहले उठाया था, वह नागरिक डेटा वैज्ञानिक की अवधारणा और इस अवधारणा की ड्राइव थी। मेरे लिए, एक नागरिक डेटा वैज्ञानिक सिर्फ सही उपकरण और iPad की पसंद पर जानकारी रखने वाले नियमित लोग हैं। उन्हें गणित नहीं करना है, उन्हें एल्गोरिदम नहीं जानना है, उन्हें यह नहीं जानना है कि एल्गोरिदम और नियम डेटा को कैसे लागू किया जाए, उन्हें बस यह जानना होगा कि इंटरफ़ेस का उपयोग कैसे करना है। और यह मुझे मेरे परिचय और एक आईपैड बनाम एक पत्रिका, एक आईपैड के साथ वहां बैठे बच्चे की अवधारणा को वापस लाता है। बच्चा बहुत जल्दी, सहज ज्ञान युक्त सीख सकता है कि कैसे एक iPad के इंटरफ़ेस का उपयोग जानकारी में गोता लगाने और इसके साथ बातचीत करने के लिए किया जाता है, भले ही यह गेम या स्ट्रीमिंग मीडिया या वीडियो हो। लेकिन यह एक पत्रिका बार से एक ही प्रतिक्रिया या बातचीत नहीं कर सकता है और पृष्ठ के बाद बस चमकती पृष्ठ है, जो बहुत आकर्षक नहीं है, खासकर यदि आप एक बच्चा है जो आईपैड के साथ बड़ा हुआ है। वास्तव में, मनुष्य बहुत तेज़ी से देख सकता है और सीख सकता है कि उपकरण और चीजें कैसे चलाएं जो अगर हम उन्हें प्रदान करते हैं, और यदि हम उन्हें मोबाइल उपकरणों और विशेष रूप से टैबलेट और स्मार्टफोन जैसे बड़े पर्याप्त स्क्रीन वाले इंटरफ़ेस प्रदान करते हैं, और विशेष रूप से यदि आप बातचीत कर सकते हैं। उन्हें स्पर्श में, उंगली की गति के साथ, अचानक आपको एक नागरिक डेटा वैज्ञानिक की यह अवधारणा मिलती है।

कोई है जो सही उपकरणों के साथ डेटा विज्ञान को लागू कर सकता है, लेकिन वास्तव में यह जानने के बिना कि यह कैसे करना है। और जैसा कि मैंने कहा, मेरे दिमाग में बहुत कुछ, उपभोक्ता प्रभाव से प्रेरित था, जो स्थानांतरित हो गया और मांग और उद्यम में बदल गया। वास्तव में त्वरित उदाहरणों की एक जोड़ी। हम, हम में से बहुत से लोग अपने ब्लॉग और वेबसाइटों के साथ काम करना शुरू कर देते हैं, जैसे कि छोटे विज्ञापनों में या ट्रैकिंग और आंदोलन को देखते हुए, हमने Google Analytics जैसे टूल का उपयोग किया और हम इस तथ्य से अवगत थे कि हमारे ब्लॉग और छोटी वेबसाइटों में , हम वहाँ कोड के छोटे टुकड़े डाल सकते हैं और Google हमें वास्तविक समय की जानकारी देगा कि वेबसाइट पर कौन, कब और कहाँ और कैसे जा रहा है। और वास्तविक समय में हम वास्तव में लोगों को वेबसाइट को हिट करते हुए देख सकते हैं, पृष्ठों के माध्यम से जा सकते हैं और फिर गायब हो सकते हैं। और यह काफी हैरान करने वाला था। मुझे अभी भी ऐसा करना पसंद है, जब मैं उन लोगों को वास्तविक समय के विश्लेषिकी की व्याख्या करने की कोशिश करता हूं, जिन्हें मैं इसे केवल Google Analytics के साथ एक वेबसाइट दिखा रहा हूं, जिसमें प्लग इन किया गया है, और वास्तव में वेबसाइटों को हिट करने वाले लोगों के साथ लाइव इंटरैक्शन देखें और उनसे पूछें, "कल्पना करें यदि आप वास्तविक समय में अपने व्यवसाय में उन प्रकार की अंतर्दृष्टि रखते थे। ”

एक खुदरा उदाहरण लें, और शायद एक दवा, मुझे लगता है कि आप इसे अमेरिका में एक दवा की दुकान कहते हैं, एक फार्मेसी जहां आप चलते हैं और सिरदर्द की गोलियों से लेकर सन क्रीम और टोपी तक सब कुछ खरीदते हैं। वास्तविक समय की जानकारी के बिना उस संगठन को चलाने की कोशिश करना एक डरावना अवधारणा है अब हम जानते हैं कि हम क्या जानते हैं। उदाहरण के लिए, आप पैर ट्रैफ़िक को माप सकते हैं, आप स्क्रीन के एक तरफ एक स्माइली चेहरे के साथ स्टोर के चारों ओर डिवाइस लगा सकते हैं क्योंकि आप खुश हैं, और सबसे दाईं ओर एक दुखी लाल और बीच में कुछ अलग शेड्स हैं। और इन दिनों "हैप्पी या नहीं" नामक एक मंच है, जहां आप एक दुकान में चलते हैं और आप अपने लाइव ग्राहक भावना प्रतिक्रिया के आधार पर एक खुश चेहरे या उदास चेहरे पर धमाका कर सकते हैं। और यह वास्तविक समय के साथ इंटरैक्टिव हो सकता है। आप लाइव मांग-संचालित मूल्य प्राप्त कर सकते हैं। यदि इसमें बहुत से लोग हैं, तो आप कीमतों को थोड़ा बढ़ा सकते हैं, और आप स्टॉक की उपलब्धता कर सकते हैं और लोगों को बता सकते हैं, उदाहरण के लिए - एयरलाइंस, उदाहरण के लिए, लोगों को बताएंगे कि वेबसाइट पर अब आपको कितनी सीटें उपलब्ध हैं। एक फ्लाइट की बुकिंग, आप बस बेतरतीब ढंग से डायल न करें और आशा करें कि आप उड़ान भर सकते हैं और उड़ान भर सकते हैं। लाइव एचआर डेटा, आप बता सकते हैं कि लोग कब देख रहे हैं और बंद कर रहे हैं। प्रोक्योरमेंट, यदि आप खरीद में हैं और आपको लाइव डेटा मिला है, तो आप अपना अगला स्टॉक खरीदने के लिए अमेरिकी डॉलर की कीमत के मुकाबले एक घंटे के लिए इंतजार करें और हेजिंग जैसी चीजें कर सकते हैं।

जब मैं लोगों को Google Analytics दिखाता हूं और मैं उस तरह के उपाख्यान, इस यूरेका पल, इस "ए-हा!" पल को रिले करता हूं, तो यह लाइटबल्ब उनके दिमाग में उतर जाता है जैसे, "हम्म, मैं बहुत सारी जगह देख सकता हूं जहां मैं ऐसा कर सकता हूं । यदि केवल मेरे पास उपकरण थे और यदि केवल मेरे पास उस ज्ञान तक पहुंच थी। ”और अब हम इसे सोशल मीडिया में देख रहे हैं। कोई भी जो एक सामान्य सोशल मीडिया उपयोगकर्ता है, जो केवल अपने नाश्ते की तस्वीरें दिखाने के अलावा, यह देखने के लिए तरसता है कि उन्हें कितनी पसंद आ रही है और उन्हें कितना ट्रैफ़िक मिल रहा है और उन्हें कितने दोस्त मिल रहे हैं, और वे ऐसा करते हैं एनालिटिक्स टूल के रूप में कहना पसंद करता है। आप टूल का उपयोग करने के लिए .com पर जा सकते हैं, लेकिन आप Google Analytics डॉट कॉम में टाइप करें, या टॉप राइट बटन पर क्लिक करें और मेन्यू को नीचे लाएँ और इसे करें, आपको ये सुंदर, सजीव ग्राफ़ मिलते हैं जो आपको बताते हैं कि आप कितने ट्वीट करते हैं 'खुद कर रहे हैं और उनके साथ कितने इंटरैक्शन हैं। और वास्तविक समय विश्लेषिकी सिर्फ आपके व्यक्तिगत सोशल मीडिया पर। कल्पना कीजिए कि यदि हमारे पास Google Analytics और लिंक्डइन और ईबे आँकड़े आपके जैसे आने वाले हैं, लेकिन आपके कार्य वातावरण में हैं।

अब हमें अपनी उंगलियों पर वेब और मोबाइल का लाइव प्रकार मिल गया है, यह एक शक्ति अवधारणा बन गया है। और इसलिए यह मुझे मेरे निष्कर्ष पर आकर्षित करता है, और यह कि हमेशा ही मैंने पाया है कि जो संगठन उपकरण और प्रौद्योगिकी का जल्द से जल्द लाभ उठाते हैं, वे अपने प्रतिद्वंद्वियों पर इतना महत्वपूर्ण लाभ प्राप्त करते हैं कि प्रतियोगी वास्तव में कभी पकड़ नहीं सकते। और हम यह देख रहे हैं कि अब नागरिक डेटा वैज्ञानिक के संघर्ष के साथ। यदि हम कौशल के साथ लोगों को ले जा सकते हैं, तो ज्ञान है कि हम उन्हें काम पर रखा है, और हम उन्हें सही उपकरण दे सकते हैं, विशेष रूप से वास्तविक समय डेटा को देखने और डेटा की खोज करने की क्षमता है और जानते हैं कि यह क्यूबिकल्स के आसपास चलने के बिना कहां है। और ज़ोर से प्रश्न पूछें, लोगों के साथ कुछ तुलनात्मक विश्लेषण करने के लिए वाटर कूलर पर जाकर खड़े हो जाएँ या जाएँ और रिसेप्शन से पूछें कि सूचकांक कहाँ है। यदि वे अपनी उंगलियों पर ऐसा कर सकते हैं और वे इसे उनके साथ अपनी बैठकों में ले जा सकते हैं और हार्डकॉपी के बजाय वास्तविक समय में स्क्रीन के माध्यम से फ़्लर्ट करने वाले बोर्डरूम में बैठ सकते हैं, तो अचानक हमने अपने कर्मचारियों को सशक्त बना दिया है जिन्हें वास्तविक होने की आवश्यकता नहीं है डेटा वैज्ञानिक, लेकिन वास्तव में डेटा विज्ञान का उपयोग करते हैं और संगठनों के लिए अद्भुत परिणाम चलाते हैं। और मुझे लगता है कि यह टिपिंग पॉइंट हम वास्तव में अब पारित कर चुके हैं, जहाँ उपभोक्ता को उद्यम में शामिल किया गया है, चुनौती यह है कि हम उस उद्यम को कैसे प्रदान करते हैं, और यह वह विषय है जिसकी मैं आज की चर्चा का अनुमान लगाता हूँ। और इसके साथ ही, मैं अपने टुकड़े को लपेटने जा रहा हूं और यह सुनने के लिए कि हम कैसे हल कर सकते हैं। डेविड, आपके ऊपर।

डेविड स्वीनर: सब ठीक है, बहुत बहुत धन्यवाद दोस्तों, और धन्यवाद रॉबिन। आप जानते हैं, रॉबिन, मैं आपके मूल मूल्यांकन से सहमत हूं। विश्लेषणात्मक प्रक्रिया, यह वास्तव में सॉफ्टवेयर विकास से अलग नहीं है। मुझे लगता है कि एक संगठन के भीतर चुनौती वास्तव में है, आप जानते हैं, शायद चीजें अच्छी तरह से परिभाषित नहीं होती हैं, शायद इसके लिए एक खोजपूर्ण घटक है, और इसके लिए एक रचनात्मक घटक है। और डीज़, आप जानते हैं, मैं आपसे सहमत हूं, पहिया को फिर से मजबूत करने के लिए बहुत कुछ है, और आप जानते हैं, एक संगठन नहीं है जिसे मैं आज जाता हूं, आप सवाल करते हैं, ठीक है, आप इसे इस तरह क्यों कर रहे हैं? व्यवसाय इस तरह से क्यों चलता है? और यह सवाल करना आसान है, और जब आप किसी संगठन के भीतर होते हैं, तो इसे बदलना बहुत कठिन होता है। मैं सादृश्य से प्यार करता हूं, चीजों का उपभोग। और इसलिए अब जब मैं हवाई अड्डे पर जाता हूं और अपनी सीट बदलना चाहता हूं - मैं इसे अपने सेलफोन पर करता हूं। मुझे बूथ पर एजेंट के पास नहीं जाना है, और उस एजेंट को मेरी सीट असाइनमेंट को बदलने के लिए 15 मिनट के लिए मोनोक्रोम मॉनिटर पर कुछ टाइप करें। मैं इसे अपने फोन पर करना पसंद करता हूं, और इसलिए यह एक दिलचस्प विकास है।

आज, हम सामूहिक बुद्धि के बारे में थोड़ी बात करने जा रहे हैं। जो लोग जागरूक नहीं हैं, उनके लिए स्टैटिस्टिका एक अग्रणी एनालिटिक्स प्लेटफॉर्म है, जो कि लगभग 30 वर्षों से है। यदि आप विश्लेषक उद्योग में किसी भी प्रकाशन को देखते हैं, तो यह हमेशा सबसे अधिक सहज और उन्नत एनालिटिक्स सॉफ़्टवेयर पैकेज का उपयोग करने में आसान होता है। इसलिए हमने पिछले कुछ वर्षों को सामूहिक बुद्धिमत्ता की अवधारणा पर काम करते हुए बिताया है, और हम इसे अगले स्तर पर ले जा रहे हैं। मैं इस बातचीत को शुरू करना चाहता था: आपके संगठन में काम कैसे होता है?

और यहाँ दो चित्र हैं। बाईं ओर एक 1960 के दशक से एक छवि है, और मैंने 1960 के दशक में अपना कैरियर शुरू नहीं किया था, लेकिन दाईं ओर की छवि है - यह एक अर्धचालक कारखाना है जहां मैंने काम करना शुरू किया था। और मैंने उस काली इमारत में काम किया, ऊपर की बाईं तरफ काली छत। लेकिन उन्होंने अर्धचालक सामान बनाया। यह Google छवियां की एक हालिया तस्वीर है। लेकिन जब आप बाईं ओर 1960 की छवि में वापस जाते हैं, तो यह बहुत दिलचस्प है। आपके पास ये लोग एक पंक्ति में बैठे हैं, और वे बना रहे हैं, आप जानते हैं, एकीकृत सर्किट और अर्धचालक। लेकिन एक मानकीकरण है, चीजों को करने का एक मानक तरीका है, और एक अच्छी तरह से परिभाषित प्रक्रिया थी। आप जानते हैं, शायद चूंकि ये सभी लोग खुले वातावरण में बैठे हैं, शायद कुछ सहयोग था। मुझे लगता है कि हमने ज्ञान कार्यबल के भीतर थोड़ा सा खो दिया है।

जब मैं ऊपरी बाईं ओर उस इमारत में बैठा था, अगर मैं किसी के साथ सहयोग करना चाहता था, तो यह खुला नहीं था। ये कार्यालय थे, शायद कुछ टीम रिमोट थी, या शायद मुझे इस परिसर में ट्रेक करना था; यह 25 मिनट की पैदल दूरी पर था, और मुझे इस इमारत में सबसे दूर किसी से बात करने जाना था। मुझे लगता है कि हमने रास्ते में कुछ खो दिया है। और इसलिए, आप जानते हैं, मेरा भी यही विचार था, लोग क्यों - आपके संगठन के भीतर कितने लोग पहिया को सुदृढ़ करते रहते हैं? मुझे लगता है, आप जानते हैं, 1990 और 2000 के दशक में CRM और डेटा वेयरहाउसिंग और एक हद तक BI के साथ समग्र रूप से संगठनों ने अच्छा काम किया। किसी कारण से, एनालिटिक्स थोड़ा पिछड़ गया है। डेटा वेयरहाउसिंग, और मानकीकरण, और आपके डेटा को सामान्य करने और इस सब और CRM में महत्वपूर्ण निवेश थे, लेकिन एनालिटिक्स किसी कारण से पिछड़ गया है। और मैं सोच रहा था कि क्यों। हो सकता है कि कोई रचनात्मक हो - हो सकता है कि आपकी प्रक्रिया अच्छी तरह से परिभाषित न हो, हो सकता है कि आप यह नहीं जानते हों कि आप किस निर्णय या लीवर को बदलने की कोशिश कर रहे हैं, आप जानते हैं, अपने व्यवसाय में चीजों को बदलने के लिए। जब हम आज संगठनों में जाते हैं, तो बहुत सारे लोग स्प्रेडशीट में बहुत मैन्युअल रूप से काम कर रहे हैं।

और आप जानते हैं, मैंने आज सुबह एक स्टेट को देखा, मुझे लगता है कि उसने कहा कि 80, 90 प्रतिशत स्प्रेडशीट में त्रुटियां हैं, और इनमें से कुछ बहुत महत्वपूर्ण हो सकते हैं। व्हेल में एक की तरह, जहां जेपी मॉर्गन चेस ने स्प्रेडशीट त्रुटियों के कारण अरबों और अरबों डॉलर खो दिए। इसलिए मुझे लगता है कि मुझे लगता है कि चीजों को प्राप्त करने का एक बेहतर तरीका होना चाहिए। और जैसा कि हमने उल्लेख किया है, हमारे पास ये डेटा वैज्ञानिक हैं। ये लोग महंगे हैं, और उन्हें खोजना मुश्किल है। और कभी-कभी वे एक अजीब बतख के रूप में होते हैं। लेकिन मुझे लगता है, आप जानते हैं, अगर मुझे यह बताना पड़ता कि डेटा वैज्ञानिक क्या होता है, तो यह संभवत: कोई है जो डेटा को समझता है। मुझे लगता है कि यह कोई है जो गणित को समझता है, कोई है जो समस्या को समझता है। और वास्तव में, कोई है जो परिणामों का संचार कर सकता है। और यदि आप एक डेटा वैज्ञानिक हैं, तो आप इन दिनों बहुत भाग्यशाली हैं, क्योंकि पिछले कुछ वर्षों में आपका वेतन शायद दोगुना हो गया है।

लेकिन सच कहा जाए तो बहुत सारे संगठन, इन डेटा वैज्ञानिकों के पास नहीं हैं, लेकिन आपके संगठन में स्मार्ट लोग हैं। आपके पास एक संगठन है, आपके पास बहुत सारे स्मार्ट लोग हैं, और वे स्प्रेडशीट का उपयोग करते हैं। आप जानते हैं, आंकड़े और गणित उनका प्राथमिक काम नहीं है, लेकिन वे व्यवसाय को आगे बढ़ाने के लिए डेटा का उपयोग करते हैं। वास्तव में, हम जो चुनौती दे रहे हैं वह यह है कि आप कैसे लेते हैं, यदि आप भाग्यशाली हैं कि आपके पास एक डेटा वैज्ञानिक या एक सांख्यिकीविद् या दो हैं, तो आप उन्हें कैसे ले सकते हैं, और आप उन लोगों और लोगों के बीच सहयोग को कैसे बेहतर बना सकते हैं आपके संगठन में अन्य व्यक्ति? यदि हम इस बात पर एक नज़र डालते हैं कि हमारा संगठन किस प्रकार संरचित है, तो मैं शुरू करने जा रहा हूँ, और मैं दाएँ से बाएँ जा रहा हूँ। और मुझे पता है कि यह पीछे की ओर है, लेकिन हमारे पास व्यापार उपयोगकर्ताओं की यह पंक्ति है।

यह आपके ज्ञान कार्यकर्ता आबादी का थोक है, और इन लोगों के लिए, आपको अपने व्यापार अनुप्रयोगों की लाइन में एनालिटिक्स को एम्बेड करने की आवश्यकता है। शायद वे कॉल सेंटर स्क्रीन या किसी चीज़ पर एनालिटिक आउटपुट देख रहे हैं, और यह उन्हें एक ग्राहक को देने के लिए अगला सबसे अच्छा प्रस्ताव बता रहा है। हो सकता है कि यह किसी वेब पोर्टल पर उपभोक्ता या आपूर्तिकर्ता है, और यह तुरंत उन्हें क्रेडिट, या जैसी चीजें देता है। लेकिन विचार यह है कि वे एनालिटिक्स का उपभोग कर रहे हैं। यदि हम बीच में जाते हैं, तो ये ज्ञान कार्यकर्ता हैं। ये वे लोग हैं जो आज स्प्रेडशीट के साथ काम कर रहे हैं, लेकिन स्प्रेडशीट त्रुटि-प्रवण हैं और कुछ बिंदु पर वे गैस से बाहर निकलते हैं। ये नागरिक डेटा वैज्ञानिक, जैसा कि हम उन्हें कहते हैं, आप जानते हैं, हम उनके लिए क्या करने की कोशिश कर रहे हैं, वास्तव में स्वचालन के स्तर को बढ़ाते हैं।

और आप एनालिटिक्स के साथ सुनते हैं कि 80 से 90 प्रतिशत काम डेटा प्रीप पीस में है, और यह वास्तविक गणित नहीं है, लेकिन यह डेटा प्रीप है। हम यह सुनिश्चित करने की कोशिश कर रहे हैं कि आप ऐसा करते हैं या नहीं, और हमारे पास जादूगर और टेम्पलेट और पुन: प्रयोज्य चीजें हैं, और आपको वास्तव में आपके पर्यावरण के भीतर अंतर्निहित बुनियादी ढांचे का ज्ञान नहीं है। और फिर अगर हम सुदूर बाईं ओर देखें, तो हमारे पास ये डेटा वैज्ञानिक हैं। और जैसा मैंने उल्लेख किया है, वे कम आपूर्ति में हैं। और हम उन्हें और अधिक उत्पादक बनाने के लिए क्या करने की कोशिश कर रहे हैं, उन्हें उन चीजों को बनाने की अनुमति है जो ये नागरिक डेटा वैज्ञानिक कर सकते हैं। इसे लेगो ब्लॉक की तरह समझें, इसलिए ये डेटा वैज्ञानिक एक पुन: प्रयोज्य संपत्ति बना सकते हैं जो एक नागरिक डेटा वैज्ञानिक उपयोग कर सकते हैं। इसे एक बार बनाएं, इसलिए हमें पहिया को फिर से चालू रखना होगा।

और फिर, ये लोग चिंतित हो सकते हैं कि क्या हम डेटाबेस में चीजें कर सकते हैं, और मौजूदा प्रौद्योगिकी निवेश का लाभ उठा सकते हैं जो आपकी कंपनी ने बनाया है। आप जानते हैं, दुनिया भर में डेटा को फेरबदल करने के लिए इस दिन और उम्र का कोई मतलब नहीं है। इसलिए यदि हम स्टेटिस्टिका को देखें, जैसे मैंने उल्लेख किया है, तो यह एक ऐसा मंच है जो काफी लंबे समय से आसपास है। और यह एक बहुत ही नवीन उत्पाद है। डेटा सम्मिश्रण, कोई डेटा स्रोत नहीं है जिसे हम एक्सेस नहीं कर सकते। हमारे पास सभी डेटा खोज और विज़ुअलाइज़ेशन चीजें हैं जो आप उम्मीद करेंगे; हम इसे वास्तविक समय में कर सकते हैं। और शायद यह है - मुझे लगता है कि सॉफ्टवेयर टूल के भीतर 16,000 से अधिक विश्लेषणात्मक कार्य हैं, इसलिए जितना मैं कभी भी उपयोग या समझ सकता हूं, उससे अधिक गणित है, लेकिन अगर आपको इसकी आवश्यकता है तो यह वहां है।

हमारे पास वास्तव में एक व्यावसायिक निर्णय लेने के लिए व्यावसायिक नियमों और विश्लेषणात्मक वर्कफ़्लो दोनों को संयोजित करने की क्षमता है। आप यहाँ से आगे जा रहे हैं, यहाँ एक एल्गोरिथ्म है, यहाँ एक वर्कफ़्लो है, लेकिन आपके पास व्यावसायिक नियम हैं जिनसे आपको हमेशा निपटना है। हम शासन में बहुत सुरक्षित हैं। हम बहुत सारे फार्मास्युटिकल क्लाइंट में उपयोग किए जाते हैं, जिसमें एफडीए हम पर भरोसा करता है। आप जानते हैं, केवल इस बात का प्रमाण है कि हमारे पास नियंत्रण और ऑडिट क्षमता उनके द्वारा स्वीकार किए जाने की क्षमता है। और फिर अंत में, आप जानते हैं, हम खुले और लचीले और एक्स्टेंसिबल हैं, इसलिए आपको एक ऐसा प्लेटफॉर्म बनाने की आवश्यकता है, जो कि आप चाहते हैं कि आपके डेटा वैज्ञानिक उत्पादक हों, आप चाहते हैं कि आपके नागरिक डेटा वैज्ञानिक उत्पादक हों, आप सक्षम होना चाहते हैं अपने संगठन के भीतर श्रमिकों के लिए इन विश्लेषणात्मक उत्पादन को तैनात करने के लिए।

यदि हम इस पर एक नज़र डालें, तो यहां कुछ दृश्यावली का उदाहरण दिया गया है। लेकिन अपने एनालिटिक आउटपुट को लाइन-ऑफ-बिजनेस उपयोगकर्ताओं में वितरित करने में सक्षम होने के नाते, इसलिए बाईं ओर पहला उदाहरण, नेटवर्क एनालिटिक्स आरेख है। और शायद आप एक धोखाधड़ी जांचकर्ता हैं, और आप नहीं जानते कि ये कनेक्शन कैसे बने हैं, और ये लोग हो सकते हैं, ये संस्थाएं हो सकती हैं, ये अनुबंध हो सकते हैं, वास्तव में कुछ भी। लेकिन आप इसे अपने माउस के साथ जोड़-तोड़ कर सकते हैं, और इसके साथ बातचीत कर सकते हैं वास्तव में समझने के लिए - यदि आप एक धोखाधड़ी जांचकर्ता हैं, तो प्राथमिकता सूची को समझने के लिए कि जांच किसने की है, ठीक है, क्योंकि आप हर किसी से बात नहीं कर सकते हैं, इसलिए आपके पास है प्राथमिकता देना।

यदि हम वहाँ पर दाईं ओर की छवि को देखते हैं, एक भविष्य कहनेवाला रखरखाव डैशबोर्ड के लिए, यह वास्तव में एक दिलचस्प समस्या है। शायद आप एक हवाई अड्डे के मालिक हैं, और आपके पास वहाँ ये बॉडी स्कैनर हैं। ये बॉडी स्कैनर, यदि आप किसी हवाईअड्डे पर जाते हैं, तो वहाँ कुछ घटक होते हैं जिनमें लगभग नौ महीने का शैल्फ जीवन होता है। और ये चीजें वास्तव में, वास्तव में महंगी हैं। यदि मेरे हवाईअड्डे में कई प्रवेश बिंदु, कई स्कैनर हैं, तो नंबर एक मैं यह सुनिश्चित करना चाहता हूं कि मैं प्रत्येक द्वार पर उचित रूप से तैनात हूं, और कुछ हिस्सों के लिए जो स्कैनर में हैं, मैं उन्हें भी ऑर्डर नहीं देना चाहता हूं जल्दी, और मैं इससे पहले कि वे टूट जाता है करना चाहते हैं। हमारे पास क्षमता है, हो सकता है कि यदि आप एक हवाई अड्डे के मालिक हों, तो यह अनुमान लगाने में सक्षम होने के लिए कि ये चीजें कब टूटेंगी और स्टाफ के स्तर की भविष्यवाणी करेगी।

यदि हम निचले दाईं ओर देखते हैं, तो यदि आप निर्माण के माहौल में हैं, तो यह विनिर्माण प्रवाह का केवल एक चित्रमय प्रतिनिधित्व है। और यह देखना थोड़ा कठिन है, लेकिन इन विभिन्न प्रक्रिया क्षेत्रों पर लाल और हरे रंग की ट्रैफिक लाइटें हैं, और इसलिए यदि मैं एक इंजीनियर हूं, तो वहां बहुत परिष्कृत गणित चल रहा है, लेकिन मैं उस विशेष प्रक्रिया क्षेत्र में नीचे की ओर देख सकता हूं पैरामीटर, और इनपुट, जो शायद नियंत्रण से बाहर हो सकता है। यदि हम अपने नागरिक डेटा वैज्ञानिक को देखते हैं, तो हमारा लक्ष्य वास्तव में नागरिक डेटा वैज्ञानिक को आसान बनाना है। हमारे पास विजार्ड और टेम्प्लेट हैं, और मुझे लगता है कि एक चीज वास्तव में दिलचस्प है, क्या हमारे पास यह स्वचालित डेटा स्वास्थ्य जांच नोड है। और वास्तव में यह क्या करता है, इसमें अंतर्निहित स्मार्ट हैं।

मैंने डेटा प्रस्तुत करने का उल्लेख किया है - यह महत्वपूर्ण समय लेता है, डेटा एकत्रीकरण और इसे तैयार करने दोनों में। लेकिन मान लें कि मेरे पास मेरा डेटा है, मैं इसे इस डेटा हेल्थ चेक नोड के माध्यम से चला सकता हूं, और यह इनवेरियन, और स्पार्सनेस, और आउटलेर और इन सभी चीजों के लिए जांच करता है, यह लापता मानों में भरता है और यह बहुत सारे गणित करता है जो मैं डॉन समझ नहीं है, इसलिए मैं या तो चूक स्वीकार कर सकता हूं, या यदि मैं थोड़ा अधिक चतुर हूं, तो मैं उन्हें बदल सकता हूं। लेकिन बात यह है कि हम उस प्रक्रिया को स्वचालित करना चाहते हैं। यह बात एक साफ़ किए गए डेटा सेट पर लगभग 15 अलग-अलग जाँच और परिणाम करती है। हम जो कर रहे हैं, उससे लोगों को इन वर्कफ्लो को बनाने में आसानी हो रही है।

यह वह जगह है जहाँ हम डेटा वैज्ञानिकों और नागरिक डेटा वैज्ञानिकों के बीच सहयोग के बारे में बात कर रहे हैं। यदि हम इन छवियों को दाईं ओर देखते हैं, तो हम इस डेटा को प्रस्तुत करने का वर्कफ़्लो देखते हैं। और शायद यह बहुत ही परिष्कृत है, हो सकता है कि यह आपकी कंपनी की गुप्त चटनी हो, मुझे पता नहीं है, लेकिन हम जानते हैं कि आपके संगठन में कोई व्यक्ति इनमें से एक या अधिक डेटा साइलो तक पहुंच सकता है जो हमारे पास है। हमें एक रास्ता चाहिए, नंबर एक, उन्हें पकड़ना और उन्हें एक साथ सिलाई करना, और नंबर दो, हो सकता है कि हम जिस विशेष प्रसंस्करण को करना चाहते हैं, वह हमारी डेटा स्वास्थ्य जांच से परे हो, और आपकी कंपनी की गुप्त चटनी। मैं इस वर्कफ़्लो को हमारे संगठन के भीतर बना सकता हूं, और यह नोड के रूप में ढह जाता है। आप तीर को नीचे की ओर इंगित करते हुए देखते हैं, यह सिर्फ एक नोड है, और हमारे पास संगठन के भीतर इनमें से सौ चीजें हो सकती हैं। विचार यह है, हमारे पास ऐसे लोग हैं जो एक निश्चित स्थान के बारे में कुछ जानते हैं, वे एक वर्कफ़्लो बना सकते हैं, और कोई अन्य व्यक्ति इसका पुन: उपयोग कर सकता है। हम पहिया के सुदृढीकरण को कम करने की कोशिश कर रहे हैं।

और हम विश्लेषणात्मक मॉडलिंग वर्कफ़्लो के साथ एक ही काम कर सकते हैं। दाईं ओर इस स्थिति में, यह वर्कफ़्लो, शायद 15 अलग-अलग एल्गोरिदम हैं, और मैं कार्य के लिए सबसे अच्छा चुनना चाहता हूं। और मुझे एक नागरिक डेटा वैज्ञानिक के रूप में समझने की ज़रूरत नहीं है कि उस मकड़ी के जाल में क्या गड़बड़ है, लेकिन यह बस एक नोड में ढह जाता है, और शायद यह नोड बस कहता है, "क्रेडिट जोखिम स्कोर की गणना करें।" "मौका की गणना करें। एक सर्जिकल साइट संक्रमण, "आपके पास क्या है। "धोखाधड़ी वाले लेनदेन के होने की संभावना की गणना करें।" एक नागरिक डेटा वैज्ञानिक के रूप में, मैं इस बहुत ही परिष्कृत गणित का उपयोग कर सकता हूं जिसे किसी और ने बनाया है, हो सकता है कि इनमें से एक डेटा वैज्ञानिकों ने मेरे संगठन के भीतर बनाया हो।

डेटा विज्ञान के दृष्टिकोण से, आप जानते हैं, मैंने उन डेटा वैज्ञानिकों से बात की है जिन्हें कोड लिखना पसंद है, और मैंने उन डेटा वैज्ञानिकों से बात की है जिन्हें कोड लिखने से नफरत है। और यह ठीक है, इसलिए हमारे पास बहुत ही दृश्य, ग्राफिकल यूजर इंटरफेस है। हम अपना डेटा हड़प सकते हैं, हम अपना स्वचालित डेटा स्वास्थ्य जाँच कर सकते हैं, और शायद मैं कोड लिखना चाहता हूँ। मुझे पायथन पसंद है, मुझे आर पसंद है, लेकिन विचार यह है, ये डेटा वैज्ञानिक, वे कम आपूर्ति में हैं, और वे एक विशेष भाषा में कोड पसंद करते हैं। हमें विशेष रूप से यह पसंद नहीं है कि आप किस भाषा में कोड करना चाहते हैं, इसलिए यदि आप R करना चाहते हैं, तो R करें; यदि आप पायथन करना चाहते हैं, तो पायथन करें। एक दम बढ़िया। यदि आप एज़्योर के लिए अपने एनालिटिक्स को तोड़ना चाहते हैं, तो अपने एनालिटिक्स को क्लाउड पर फट करें। और इसलिए यहां लक्ष्य वास्तव में लचीलेपन और विकल्पों की पेशकश करना है जो आपके डेटा वैज्ञानिकों को उतना ही उत्पादक बना सकते हैं जितना वे हो सकते हैं।

अब डेटा वैज्ञानिक, वे बहुत स्मार्ट लोग हैं, लेकिन शायद वे हर चीज के विशेषज्ञ नहीं हैं, और शायद वे जो कुछ कर सकते हैं उसमें कुछ अंतराल है। और यदि आप उद्योग के भीतर देखते हैं, तो बहुत सारे अलग-अलग विश्लेषणात्मक बाज़ार हैं जो वहां मौजूद हैं। यह एक उदाहरण है, शायद मुझे छवि पहचान करने की आवश्यकता है और मेरे पास वह कौशल नहीं है, हो सकता है कि मैं अल्गोरिद्मिया से बाहर जाऊं और छवि पहचान एल्गोरिथ्म प्राप्त करूं। हो सकता है कि मैं अपर्विता के पास जाऊं और एक बहुत ही खास हेल्थकेयर एल्गोरिथ्म प्राप्त करूं। शायद मैं एज़्योर मशीन लर्निंग लाइब्रेरी में कुछ उपयोग करना चाहता हूं। शायद मैं मूल सांख्यिकीय मंच में कुछ का उपयोग करना चाहता हूं।

फिर, यहाँ विचार यह है कि हम वैश्विक विश्लेषिकी समुदाय का लाभ उठाना चाहते हैं। क्योंकि आपके पास अपनी चार दीवारों के भीतर सभी कौशल नहीं हैं, इसलिए हम सॉफ्टवेयर कैसे बना सकते हैं - और यह हम क्या कर रहे हैं - जो आपके डेटा वैज्ञानिकों को विभिन्न प्रकार के बाज़ार से एल्गोरिदम का उपयोग करने की अनुमति देता है। हम इसे लंबे समय से आर और पायथन के साथ कर रहे हैं, लेकिन यह इन ऐप मार्केटप्लेस के लिए विस्तारित हो रहा है जो वहां मौजूद हैं। और जो आप यहां देखते हैं, उसके ऊपर हम स्पार्क पर एच 2 ओ का उपयोग कर रहे हैं, इसलिए वहां बहुत सारे विश्लेषणात्मक एल्गोरिदम हैं। आपको इन्हें स्क्रैच से बनाने पर ध्यान नहीं देना चाहिए, इनका पुनः उपयोग करें जो खुले स्रोत समुदाय में रहते हैं, और हम चाहते हैं कि ये लोग यथासंभव उत्पादक हों।

अगला कदम, जब हमारे पास हमारे नागरिक डेटा वैज्ञानिक और हमारे डेटा वैज्ञानिक हैं, तो वास्तव में आप कैसे इन सर्वोत्तम प्रथाओं को बढ़ावा देते हैं और वितरित करते हैं? हमारे पास हमारे सॉफ़्टवेयर में तकनीक है जो आपको कहीं भी एनालिटिक्स वितरित करने की अनुमति देती है। और यह एक मॉडल प्रबंधन के दृष्टिकोण से अधिक है, लेकिन अब मैं चार दीवारों या तुलसा या ताइवान या कैलिफोर्निया के भीतर एक विशिष्ट स्थापना से बाध्य नहीं हूं, या आपके पास क्या है। यह एक वैश्विक मंच है, और हमारे पास कई, कई ग्राहक हैं जो इसे कई साइटों द्वारा इसके उपयोग में तैनात करते हैं।

और इसलिए वास्तव में, प्रमुख चीजें हैं, यदि आप ताइवान में कुछ कर रहे हैं और आप इसे ब्राजील में दोहराना चाहते हैं, तो यह बहुत अच्छा है। वहाँ जाओ, पुन: प्रयोज्य टेम्पलेट्स को पकड़ो, आप चाहते हैं कि वर्कफ़्लोज़ को पकड़ो। यह उन मानकों और चीजों को करने का सामान्य तरीका बनाने की कोशिश कर रहा है, इसलिए हम हर जगह चीजों को पूरी तरह से अलग नहीं कर रहे हैं। और इसका दूसरा प्रमुख घटक, क्या वास्तव में हम गणित को उस स्थान पर ले जाना चाहते हैं जहाँ डेटा रहता है। आप के बीच डेटा फेरबदल करने के लिए नहीं है, तुम्हें पता है, कैलिफोर्निया और तुलसा और ताइवान और ब्राजील। हमारे पास ऐसी तकनीक है जो हमें गणित को डेटा तक ले जाने की अनुमति देती है, और हम उस विषय पर एक और हॉट टेक्नोलॉजी वेबकास्ट करने जा रहे हैं।

लेकिन हम इस आर्किटेक्चर को कहते हैं, और यहाँ एक चुपके झलक है, मूल निवासी वितरित विश्लेषिकी वास्तुकला। इसके पीछे महत्वपूर्ण विचार यह है कि हमारे पास एक मंच है, स्टेटिस्टिका, और मैं एक परमाणु के रूप में एक विश्लेषणात्मक वर्कफ़्लो का निर्यात कर सकता हूं। और मैं एक मॉडल, या संपूर्ण वर्कफ़्लो कर सकता था, ताकि कोई फर्क न पड़े। लेकिन मैं इसे बना सकता हूं, और इसे लक्ष्य प्लेटफॉर्म के लिए उपयुक्त भाषा में निर्यात कर सकता हूं। इसके बाईं ओर, बहुत सारे लोग ऐसा करते हैं, लेकिन वे स्रोत प्रणाली में स्कोरिंग करते हैं। यह ठीक है, हम स्कोरिंग कर सकते हैं और हम डेटाबेस में मॉडल निर्माण कर सकते हैं, ताकि दिलचस्प हो।

और फिर दाईं ओर, हमारे पास Boomi है। यह एक साथी तकनीक है, हम इन सभी के साथ काम करते हैं। लेकिन हम इन वर्कफ़्लो को भी ले सकते हैं, और अनिवार्य रूप से इसे दुनिया में कहीं भी ले जा सकते हैं। कोई भी चीज जिसका IP पता हो। और मुझे सार्वजनिक या निजी क्लाउड पर स्टैटिस्टिका स्थापित करने की आवश्यकता नहीं है। जो कुछ भी जेवीएम चला सकता है, हम इन विश्लेषणात्मक वर्कफ़्लोज़, डेटा प्रीप वर्कफ़्लोज़, या इनमें से किसी भी लक्ष्य प्लेटफ़ॉर्म पर केवल मॉडल चला सकते हैं। चाहे वह मेरे सार्वजनिक या निजी क्लाउड में हो, चाहे वह मेरे ट्रैक्टर में हो, मेरी कार में हो, मेरे घर पर हो, मेरे लाइटबल्ब, मेरी इंटरनेट ऑफ थिंग्स में, हमारे पास ऐसी तकनीक है जो आपको दुनिया में कहीं भी उन वर्कफ्लो को ले जाने की अनुमति देती है।

पिछली समीक्षा। आप जानते हैं, हमारे पास व्यावसायिक उपयोगकर्ताओं की लाइन है, इसलिए इन लोगों के पास, हमारे पास ऐसी तकनीक है जो उन्हें एक ऐसे प्रारूप में आउटपुट का उपभोग करने की अनुमति देती है जिसके साथ वे सहज हैं। हमारे पास नागरिक डेटा वैज्ञानिक हैं, और हम जो करने की कोशिश कर रहे हैं, वह सहयोग में सुधार कर रहा है, उन्हें एक टीम का हिस्सा बनाता है, है ना? और इसलिए हम चाहते हैं कि लोग पहिए को फिर से लगाना बंद करें। और हमारे पास ये डेटा वैज्ञानिक हैं, वहां एक कौशल अंतर हो सकता है, लेकिन वे जिस भाषा में चाहें कोड कर सकते हैं, वे विश्लेषणात्मक बाजारों में जा सकते हैं और वहां एल्गोरिदम का उपयोग कर सकते हैं। और इसके साथ, आप यह कैसे नहीं सोच सकते हैं कि सब कुछ इस के साथ भयानक है? यह सही है, हम यही कर रहे हैं। हम पुन: प्रयोज्य वर्कफ़्लो का निर्माण कर रहे हैं, हम लोगों को निर्देश दे रहे हैं, हम उन्हें लेगो ब्लॉक दे रहे हैं ताकि वे इन शक्तिशाली महल का निर्माण कर सकें और जो भी वे करना चाहते हैं। इसे योग करने के लिए, हमारे पास एक मंच है जो व्यापार उपयोगकर्ताओं, नागरिक डेटा वैज्ञानिकों, प्रोग्रामर डेटा वैज्ञानिकों की सशक्तिकरण लाइन है, हमारे पास है - हम किसी भी प्रकार के IoT एज एनालिटिक्स उपयोग के मामले को संबोधित कर सकते हैं, और हम सामूहिक बुद्धि की इस धारणा को सक्षम कर रहे हैं। इसके साथ, मुझे लगता है कि हम शायद इसे प्रश्नों के लिए खोल देंगे।

रॉबिन ब्लोर: चलो ठीक है। मुझे लगता है कि पहला - मेरा मतलब है, ईमानदार होना, मेरा मतलब है कि मुझे पहले डेल स्टैटिस्टिका द्वारा ब्रीफ किया गया है, और ईमानदार होने के लिए मैं वास्तव में उन चीजों पर काफी आश्चर्यचकित हूं जो मुझे नहीं पता था कि आप प्रस्तुति में लाए थे । और मुझे यह कहना होगा कि एक चीज, यह कुछ ऐसा है जो मेरे लिए विश्लेषिकी को अपनाने के लिए बहुत ही बुरा है, क्या यह है कि आप जानते हैं, उपकरण प्राप्त करना यह नहीं है, आप जानते हैं? वहाँ बहुत सारे उपकरण हैं, वहाँ पर खुले स्रोत के उपकरण हैं, और इसी तरह आगे, और वहाँ विभिन्न है, जिसे मैं कॉल, सेमी-प्लेटफ़ॉर्म कहता हूँ। लेकिन मुझे लगता है कि आपके पास जो अंतर है, मैं विशेष रूप से कुछ वर्कफ़्लो से प्रभावित था।

लेकिन आप अंतर को अंत प्रदान करने के लिए लग रहे हैं। यह एनालिटिक्स की तरह एक परिष्कृत व्यवसाय प्रक्रिया है जो डेटा के अधिग्रहण से शुरू होती है और फिर यह डेटा की कितनी परतदार होती है, इसके आधार पर चरणों की एक पूरी श्रृंखला से गुजरती है, और फिर यह विभिन्न गणितीय हमलों की एक पूरी श्रृंखला में शाखा कर सकती है डेटा। और फिर परिणाम एक तरह से या किसी अन्य रूप में सामने आते हैं और उन पर कार्रवाई करने की आवश्यकता होती है। मेरे पास बहुत अधिक मात्रा में विश्लेषिकी हैं जहां बहुत सारे महान कार्य किए गए थे, लेकिन इसे कार्रवाई में नहीं रखा गया है। और आपको लगता है कि बहुत जरूरी है। मुझे नहीं पता कि यह कितना व्यापक है, लेकिन यह मेरी अपेक्षा से अधिक व्यापक है। मैं इससे बेहद प्रभावित हूं।

मैं चाहूंगा कि आप स्प्रैडशीट पर टिप्पणी करें। आप पहले से ही कुछ कह चुके हैं, लेकिन उन चीजों में से एक जो मैंने नोट किया है, और मैंने वर्षों से नोट किया है, लेकिन यह सिर्फ अधिक से अधिक स्पष्ट हो गया है, क्या यह स्प्रेडशीट का एक बहुत कुछ है जो छाया प्रणाली हैं और वास्तव में मुझे लगता है स्प्रेडशीट, मेरा मतलब है, यह एक अद्भुत उपकरण था जब इसे पेश किया गया था और यह कई तरीकों से बहुत शानदार रहा है, लेकिन यह एक सामान्यीकृत उपकरण है, यह वास्तव में उद्देश्य के लिए फिट नहीं है। यह निश्चित रूप से बीआई कॉन में बहुत अच्छा नहीं है और मुझे लगता है कि यह एनालिटिक्स कॉन में भयानक है। और मुझे आश्चर्य है कि अगर आपके पास कुछ टिप्पणी करने के बारे में है, तो आइए बताते हैं, उदाहरण के लिए, आप जानते हैं कि, स्टेटिस्टिका ने बाहर निकाल दिया है, अत्यधिक स्प्रेडशीट का उपयोग किया है, या कोई भी टिप्पणी जो आप इस बारे में बनाना चाहते हैं?

डेविड स्वीनर: हाँ, मुझे लगता है कि, आप जानते हैं, आप प्रसिद्ध स्प्रेडशीट गलतियों को देख सकते हैं। Google या जो भी खोज इंजन आप उपयोग कर रहे हैं, वह परिणामों के लिटनी के साथ वापस आएगा। मुझे नहीं लगता, आप जानते हैं, हम कभी भी स्प्रैडशीट बदल देंगे। यह हमारा उद्देश्य नहीं है, लेकिन बहुत सारे संगठन जो मैं जाते हैं, इन स्प्रेडशीट जादूगरों या निनजाओं या जो भी आप उन्हें कॉल करना चाहते हैं, उनमें से एक युगल है, लेकिन उनके पास ये बहुत ही परिष्कृत स्प्रैडशीट हैं और आपको सोचना होगा कि ये क्या होता है लोग लोट्टो जीतते हैं और वे वापस नहीं आते हैं? और इसलिए हम जो करने की कोशिश कर रहे हैं, हम जानते हैं कि स्प्रेडशीट मौजूद होगी इसलिए हम उन को निगलना कर सकते हैं, लेकिन मुझे लगता है कि हम जो करने की कोशिश कर रहे हैं, वह आपके वर्कफ़्लो का एक विज़ुअल प्रतिनिधित्व विकसित कर रहा है ताकि इसे अन्य लोगों के साथ समझा और साझा किया जा सके। । स्प्रेडशीट बहुत कठिन हैं, साझा करने के लिए बहुत कठिन हैं। और जैसे ही आप अपनी स्प्रेडशीट मेरे पास देते हैं, मैंने इसे बदल दिया है, और अब हम सिंक से बाहर हैं और हम अलग-अलग उत्तर दे रहे हैं। हम जो करने की कोशिश कर रहे हैं, उसके चारों ओर कुछ रेलिंग लगाई जाती हैं और चीजों को थोड़ा और कुशल बना देती हैं। और स्प्रेडशीट वास्तव में कई डेटा सेटों को एक साथ जोड़कर भयानक हैं, आप जानते हैं? वे वहीं गिर पड़े। लेकिन हम उन्हें बदलने नहीं जा रहे हैं, हम उन्हें निगलना चाहते हैं और हमारे पास ऐसे लोग हैं जो शिफ्ट होने लगे हैं क्योंकि अगर हमारे पास एक नोड है जो "जोखिम की गणना" कहता है कि स्प्रेडशीट का उपयोग करने वाला व्यक्ति क्या करने की कोशिश कर रहा है। तो वे चले गए।

रॉबिन ब्लोर: हाँ, मेरा मतलब है, मैं कहूंगा कि, आप जानते हैं, कि मैं जिन चीजों को देखता हूं, उनमें से एक से, मैं कहता हूं कि स्प्रेडशीट जानकारी बनाने के लिए महान हैं। वे ज्ञान के द्वीप बनाने के लिए भी महान हैं, लेकिन वे ज्ञान साझा करने के लिए वास्तव में खराब हैं। उनके पास ऐसा करने का कोई तंत्र नहीं है, और यदि आप किसी पर एक स्प्रेडशीट पास करते हैं, तो वह ऐसा नहीं है कि आप उसे पढ़ सकते हैं जैसे यह एक लेख है जिसमें बताया गया है कि वे क्या कर रहे हैं। यह वहाँ नहीं है। मुझे लगता है, आप जानते हैं, जिस चीज ने मुझे प्रस्तुति के बारे में और स्टेटिस्टिका की क्षमताओं के बारे में सबसे अधिक प्रभावित किया, वह अविश्वसनीय रूप से कृषि-संबंधी प्रतीत होता है। लेकिन इसे यह धागा वर्कफ़्लो के माध्यम से चल रहा है। क्या मैं यह मानने के लिए सही हूं कि आप अंत-से-अंत वर्कफ़्लो को देख सकते हैं, आप जानते हैं, डेटा अधिग्रहण से लेकर विशेष रूप से BI अनुप्रयोगों या यहां तक ​​कि चल रहे अनुप्रयोगों में एम्बेडिंग परिणामों तक?

डेविड स्वीनर: हाँ, बिल्कुल। और इसकी अंत-टू-एंड क्षमता है और कुछ संगठन उस पूर्णता का उपयोग करते हैं, और मैं किसी भ्रम में नहीं हूं कि कोई भी कंपनी इन दिनों एक विक्रेता से सब कुछ खरीदती है। हमारे पास एक मिश्रण है। कुछ लोग स्टैटिस्टिका का उपयोग हर चीज के लिए करते हैं और कुछ लोग इसका उपयोग मॉडलिंग वर्कफ़्लोज़ के लिए करते हैं, कुछ लोग इसका उपयोग डेटा प्रस्तुतिकरण वर्कफ़्लो के लिए करते हैं। कुछ लोग इंजीनियरों को सैकड़ों इंजीनियरिंग रिपोर्ट वितरित करने के लिए इसका उपयोग करते हैं। और इसलिए हमारे बीच सब कुछ है। और यह वास्तव में एंड-टू-एंड है और आपको पता है, एक अज्ञेय मंच है, जिसमें यदि आप उस एल्गोरिदम का उपयोग करना चाहते हैं जो आप आर या पायथन, एज़्योर, एपरविटा में उपयोग करना चाहते हैं, तो आप जो भी जानते हैं, उनका उपयोग करें। यह बहुत अच्छा है, उत्पादक बनें, जो आप जानते हैं उसका उपयोग करें, जो आप के साथ सहज हैं उसका उपयोग करें और हमारे पास यह सुनिश्चित करने के लिए तंत्र हैं कि वे नियंत्रित और श्रव्य हैं और उन सभी प्रकार की चीजों को।

रॉबिन ब्लोर: मैं विशेष रूप से इसके उस पहलू को पसंद करता हूं। मेरा मतलब है, मुझे नहीं पता कि क्या आप उससे आगे बोल सकते हैं जो आपने कहा है कि वहाँ क्या है मेरा मतलब है, मैंने इसे देखा है, लेकिन मैंने इसे व्यापक रूप में नहीं देखा है और निश्चित रूप से हमारे पुस्तकालयों में अजगर पुस्तकालयों की एक बड़ी मात्रा है, लेकिन क्या आप उस तस्वीर को जोड़ सकते हैं? क्योंकि मुझे लगता है कि यह एक बहुत ही दिलचस्प बात है, आप जानते हैं, यह विचार कि आपके पास ऐसे घटक होंगे जो विश्वसनीय थे, क्योंकि आप विभिन्न लोगों को जानते थे, जिन्होंने उन्हें बनाया था और विभिन्न लोग जो उनका उपयोग कर रहे थे, जिन्हें आप डाउनलोड कर सकते हैं। आप जानते हैं, क्या आप उस बारे में जो पहले से कह चुके हैं, उसे समृद्ध कर सकते हैं?

डेविड स्वीनर: हाँ, मुझे लगता है कि कुछ ऐप मार्केटप्लेस हैं, आप जानते हैं, एल्गोरिथ्म मार्केटप्लेस जो कि बाहर हैं। उदाहरण के लिए, आप जानते हैं, लोवा विश्वविद्यालय में डॉ। जॉन क्रॉमवेल, उन्होंने एक ऐसा मॉडल विकसित किया है जो भविष्यवाणी करेगा, जिसका वास्तविक समय में उपयोग किया जा रहा है, जबकि आप एक स्कोर प्राप्त करेंगे, यदि आप एक प्राप्त करने जा रहे हैं सर्जिकल साइट संक्रमण। और अगर उस स्कोर की अधिकता है, तो वे ऑपरेटिंग कमरे में एक हस्तक्षेप करेंगे। यह तो बहुत ही मज़ेदार है। तो शायद वहाँ एक और अस्पताल है जो उतना बड़ा नहीं है। वैसे, अपर्विता एनालिटिक्स के लिए एक हेल्थ ऐप मार्केटप्लेस है। आप या तो इन ऐप मार्केटप्लेस में से किसी एक में जा सकते हैं, आप एक को ढूंढ सकते हैं और उन्हें फिर से उपयोग कर सकते हैं, और लेन-देन आपके बीच है और जो कोई भी इसका मालिक है, लेकिन आप या तो एक ढूंढ सकते हैं या आप कह सकते हैं, "यहां मुझे क्या चाहिए। "मुझे लगता है कि यह उस वैश्विक समुदाय को परेशान कर रहा है क्योंकि हर कोई इन दिनों एक विशेषज्ञ है, और आप सब कुछ नहीं जान सकते। मुझे लगता है कि आर और पायथन एक बात है, लेकिन यह विचार, "मैं इस फ़ंक्शन को करना चाहता हूं, इन ऐप बाजार स्थानों में से एक पर एक कल्पना डाल दिया है और किसी ने इसे आपके लिए विकसित किया है।" और वे इसे मुद्रीकृत कर सकते हैं, मुझे लगता है। यह बहुत दिलचस्प है और विशुद्ध रूप से खुले स्रोत मॉडल से बहुत अलग है।

रॉबिन ब्लोर: ठीक है। वैसे भी, मैं गेंद को डीज़ को पास कर दूंगा क्या आप डीज़ में गोता लगाना चाहेंगे?

डीज़ ब्लांचफील्ड: पूरी तरह से और मैं एक पल के लिए स्प्रेडशीट चीज़ पर बने रहना पसंद करता हूं क्योंकि मुझे लगता है कि हमने यहां जो भी बात कर रहे हैं, उसके बारे में बहुत कुछ का सही पकड़ लिया है। और आपने एक टिप्पणी की, रॉबिन ने, अपने भौतिक रूप में इलेक्ट्रॉनिक रूप में पुराने स्प्रैडशीट से संक्रमण के संबंध में। हमारे पास एक दिलचस्प बात थी जहां आप जानते हैं, जब स्प्रैडशीट मूल रूप से एक चीज थी, वे पंक्तियों और स्तंभों के साथ सिर्फ कागज की शीट थीं और आप मैन्युअल रूप से चीजों को लिखेंगे, तब आप पावर करेंगे और उन्हें गणना करेंगे, या तो करके यह आपके सिर के ऊपर या किसी अन्य उपकरण के साथ बंद है। लेकिन हम अभी भी लिखावट की गलतियों या डिस्लेक्सिया के साथ त्रुटियों को कम करने का अवसर रखते हैं, और अब हमने इसे टाइपोस के साथ बदल दिया है। जोखिम यह है कि स्प्रेडशीट के साथ जोखिम प्रोफ़ाइल अधिक तेज़ और बड़ा है, लेकिन मुझे लगता है कि स्टेटिस्टिका जैसे उपकरण जोखिम पिरामिड को उलट देते हैं।

मैं अक्सर एक व्यक्ति के रूप में एक छड़ी के शीर्ष पर एक व्यक्ति के व्हाइटबोर्ड पर इस चित्र को खींचता हूं, और फिर नीचे से उनमें से एक संग्रह, चलो कहता हूं, उस व्हाइटबोर्ड के नीचे उनमें से दस की कल्पना करो, और मैं आकर्षित करता हूं पिरामिड जहां पिरामिड का बिंदु एकल व्यक्ति और पिरामिड के लोगों के पैर का बिंदु है। और मैं इसका उपयोग इस विचार को देखने के लिए करता हूं कि यदि शीर्ष पर एक व्यक्ति एक स्प्रैडशीट करता है तो वह गलती करता है और उसे दस लोगों के साथ साझा करता है, और अब हमें त्रुटि की दस प्रतियां मिल गई हैं। अपने मैक्रोज़ के साथ बहुत सावधान रहें और यदि आप उस पर जाने के लिए जा रहे हैं तो अपने विज़ुअल बेसिक से बहुत सावधान रहें। क्योंकि जब हम स्प्रेडशीट जैसे इलेक्ट्रॉनिक उपकरण बनाते हैं तो यह बहुत शक्तिशाली होता है, लेकिन यह अच्छे और बुरे तरीके से भी शक्तिशाली होता है।

मुझे लगता है कि स्टैटिस्टिका जैसे उपकरण उस जोखिम प्रोफ़ाइल को पलटने की क्षमता के बारे में लाते हैं और वह यह है कि अब आप उस बिंदु पर पहुंच सकते हैं जहां आपको बहुत सारे उपकरण मिले हैं जो व्यक्तिगत व्यक्ति के लिए उपलब्ध हैं और जैसा कि वे बहुत सारे उपकरणों से ऊपर जाते हैं पिरामिड और फिर बहुत नीचे तक जहां पिरामिड का बिंदु अब उल्टा हो रहा है, वास्तविक उपकरण है, अगर हमें उन लोगों की एक टीम मिल गई है जो उन उपकरणों और उन एल्गोरिदम का निर्माण कर रहे हैं। और डेटा वैज्ञानिक को अपने डेटा पर प्रतिगामी विश्लेषण में एक विशेषज्ञ होने की आवश्यकता नहीं है। वे उपकरण का उपयोग करने में सक्षम हो सकते हैं, लेकिन आपके पास पांच या छह सांख्यिकीविद और एक एक्टिवर और एक डेटा वैज्ञानिक और कुछ गणितज्ञ उस टूल पर काम कर सकते हैं, वह मॉड्यूल, वह एल्गोरिथ्म, जो प्लग-इन और स्प्रैडशीट समांतरता में है, इसलिए कल्पना करें कि आपके द्वारा उपयोग की जा सकने वाली प्रत्येक स्प्रेडशीट को वास्तव में उन विशेषज्ञों द्वारा लिखा गया था जिन्होंने मैक्रोज़ का परीक्षण किया, विज़ुअल बेसिक का परीक्षण किया, यह सुनिश्चित किया कि एल्गोरिदम ने काम किया है, इसलिए जब आपको यह मिला तो आप इसे केवल पॉप डेटा में बदल सकते थे लेकिन आप वास्तव में इसे तोड़ नहीं सकते थे और इसलिए इसे नियंत्रित करना बेहतर है।

मुझे लगता है कि बहुत सारे एनालिटिक्स टूल ऐसा कर रहे हैं। मुझे लगता है कि इस बिंदु पर आने का अनुमान है, क्या आप उस क्षेत्र में देख रहे हैं, क्या आप स्प्रैडशीट से संक्रमण देख रहे हैं जो संभावित रूप से त्रुटियों और गलतियों और जोखिम को धक्का दे सकता है, उस बिंदु पर जहां उपकरण आपके साथ बन रहे हैं। प्लेटफ़ॉर्म अब, डेटा की खोज वास्तविक समय में सटीक है और जो लोग मॉड्यूल और एल्गोरिदम का निर्माण कर रहे हैं, वे उस जोखिम प्रोफ़ाइल को हटा या कम कर रहे हैं? क्या ग्राहक सेवा को वास्तविक अर्थों में देख रहे हैं या आपको लगता है कि बस हो रहा है और उन्हें इसका एहसास नहीं है?

डेविड स्वीनर: आप जानते हैं, मुझे लगता है कि इसका उत्तर देने के लिए कुछ तरीके हैं। लेकिन जो हम देख रहे हैं, आप किसी भी संगठन में जानते हैं, और मैंने उल्लेख किया है कि मुझे लगता है कि एनालिटिक्स शायद एक कॉर्पोरेट निवेश के दृष्टिकोण से पिछड़ गया है, जिस तरह का डेटा वेयरहाउसिंग और सीआरएम के साथ हमने किया है। लेकिन जो हम देख रहे हैं, इसलिए उस संगठनात्मक जड़ता को खत्म करने के लिए, एक संगठन को बदलने में बहुत कुछ लगता है। लेकिन हम जो देख रहे हैं, लोग उनकी स्प्रेडशीट ले रहे हैं, उनके वर्कफ़्लो ले रहे हैं, और मैंने सुरक्षा और शासन का उल्लेख किया, "ठीक है, शायद मेरे पास एक स्प्रेडशीट है," "ठीक है, मैं इसे नीचे लॉक कर सकता हूं और मैं इसे नियंत्रित कर सकता हूं।" हम बहुत सारे संगठन देखते हैं, शायद वे वहीं से शुरू करते हैं। और अगर यह बदल गया है, तो एक वर्कफ़्लो है और मैं अंत में जा रहा हूं, हालांकि नंबर एक, जिसने इसे बदल दिया? उन्होंने इसे क्यों बदला। जब उन्होंने इसे बदल दिया। और मैं एक वर्कफ़्लो भी सेट कर सकता हूँ जैसे कि मैं इस नई स्प्रेडशीट को प्रोडक्शन में नहीं डालने जा रहा हूँ, जब तक कि यह एक, दो, तीन द्वारा सत्यापित और सत्यापित नहीं हो जाता है, हालाँकि आप अपने वर्कफ़्लो में कई पार्टियों को परिभाषित करना चाहते हैं। मुझे लगता है कि लोग लेना शुरू कर रहे हैं, और संगठन वहां बेबी कदम उठाना शुरू कर रहे हैं, लेकिन मैं शायद सुझाव दूंगा कि हमें अभी एक लंबा रास्ता तय करना है।

डीज़ ब्लांचफील्ड: वास्तव में और मुझे लगता है कि आपने सुरक्षा नियंत्रण और वहां के शासन दोनों में निर्माण किया है, फिर कार्यभार स्वचालित रूप से और सब कुछ मुख्य जोखिम अधिकारी तक पहुंच सकता है, जो अब एक बात है। आप यह नियंत्रित करना शुरू कर सकते हैं कि उन उपकरणों और प्रणालियों को कैसे एक्सेस किया जा रहा है और उनके साथ क्या कर रहे हैं, ताकि यह बहुत शक्तिशाली हो। मुझे लगता है कि इसमें आने वाली दूसरी चीजें यह है कि आपके लिए जो प्रकार के उपकरण प्रदान करते हैं, वे मेरे लिए मानव व्यवहार से अधिक पारंपरिक स्प्रेडशीट के लिए उधार देते हैं, जिसके बारे में हम बात कर रहे हैं, अगर मुझे लोगों से भरा कमरा मिला है उसी डैशबोर्ड और उसी डेटा तक पहुंच के साथ, जो वे वास्तव में एक अलग दृश्य प्राप्त कर सकते हैं और परिणामस्वरूप, एक ही जानकारी से थोड़ा अलग अंतर्दृष्टि प्राप्त करते हैं, जो उनकी आवश्यकताओं के अनुरूप है ताकि वे सहयोग कर सकें। तब हमारे पास व्यापार और निर्णय लेने की प्रक्रिया के साथ एक अधिक मानवीय दृष्टिकोण और बातचीत होती है, जैसा कि सभी एक ही PowerPoint के साथ एक ही बैठक में जाने का विरोध करते हैं, और एक ही स्प्रेडशीट सभी समान डेटा को संपादित करते हैं।

क्या आपको संगठनों में व्यवहार और संस्कृति में एक संक्रमण दिखाई देता है, जो अब आपके उपकरण उठाते हैं, जहां वे देखते हैं कि यह जगह ले रहा है, जहां यह कमरे के पांच लोगों की तरह नहीं है, जो एक ही स्प्रेडशीट को देख रहे हैं, इसे केवल मौखिक रूप से देखने और उस पर नोट्स बनाने की कोशिश कर रहे हैं , लेकिन अब वे वास्तव में डैशबोर्ड्स और उपकरणों के साथ वास्तविक समय में बातचीत कर रहे हैं, उनकी उंगलियों पर विज़ुअलाइज़ेशन और एनालिटिक्स के साथ और न केवल बैठकों में, बल्कि संगठन के चारों ओर केवल सामान्य सहयोग पर बातचीत और बातचीत पर पूरी तरह से अलग प्रवाह प्राप्त कर रहे हैं? क्योंकि वे इसे वास्तविक समय में कर सकते हैं, क्योंकि वे प्रश्न पूछ सकते हैं और वास्तविक उत्तर प्राप्त कर सकते हैं। क्या आप इस समय ऐसा चलन देख रहे हैं या अभी तक ऐसा नहीं हुआ है?

डेविड स्वीनर: नहीं, मुझे लगता है कि यह निश्चित रूप से उस रास्ते से शुरू हुआ है और मुझे लगता है कि बहुत ही दिलचस्प बात है, आप जानते हैं, अगर हम एक कारखाने का उदाहरण लेते हैं, उदाहरण के लिए। हो सकता है कि कोई व्यक्ति जो उस कारखाने के भीतर एक विशेष प्रक्रिया क्षेत्र का मालिक हो, वे एक निश्चित तरीके से इस डेटा को देखना और बातचीत करना चाहते हैं। और शायद मुझे, सभी प्रक्रियाओं को नजरअंदाज करते हुए, शायद यह एक तल पर है, शायद मैं इसे हर चीज पर देखना चाहता हूं। मुझे लगता है कि हम जो देख रहे हैं, वह नंबर एक है, लोग अपने संगठनों के भीतर विज़ुअलाइज़ेशन या मानक विज़ुअलाइज़ेशन के एक सामान्य सेट का उपयोग करना शुरू कर रहे हैं, लेकिन यह भी भूमिका के अनुरूप है। वह व्यक्ति जो आपूर्ति श्रृंखला के दृष्टिकोण से इसे देख रहा है, की तुलना में बहुत अलग दृष्टिकोण है, और मुझे लगता है कि यह बहुत अच्छा है क्योंकि इसे सिलवाया जाना है और इसे लेंस के माध्यम से देखना होगा जिसे आपको अपना काम पूरा करने की आवश्यकता है।

डीज़ ब्लांचफील्ड: मुझे लगता है कि निर्णय प्रक्रिया में समय, समय-वार और गति कम होती है, वास्तव में स्मार्ट और सटीक निर्णय लेने में तेजी से वृद्धि होती है, क्या यह नहीं है? क्योंकि अगर आपको रियल-टाइम एनालिटिक्स, रियल-टाइम डैशबोर्ड्स मिल गए हैं, अगर आपको अपनी उंगलियों पर स्टैटिस्टिकिका टूल मिल गए हैं, तो आपको किसी चीज़ के बारे में जाने और किसी से पूछने के लिए फर्श के पार नहीं जाना होगा, आपको मिल गया है हार्ड कॉपी में। आप मक्खी पर सहयोग कर सकते हैं, बातचीत कर सकते हैं और वास्तव में निर्णय ले सकते हैं। जो मुझे लगता है कि कुछ कंपनियों ने वास्तव में अभी तक नहीं समझा है, लेकिन जब वे ऐसा करते हैं, तो यह इस यूरेका का क्षण होगा कि हां, हम अभी भी अपने क्यूबिकल में रह सकते हैं और घर पर काम कर सकते हैं, लेकिन हम बातचीत कर सकते हैं और उन फैसलों को पूरा कर सकते हैं जैसा कि हम सहयोग करते हैं, हम परिणामों में तुरंत बदल जाते हैं। देखो, मुझे लगता है कि यह सुनना शानदार था कि आपको अब तक क्या कहना है और मैं वास्तव में आगे देख रहा हूं कि यह कहां जाता है। और मुझे पता है कि हमें प्रश्नोत्तर में बहुत सारे प्रश्न मिले हैं, इसलिए मैं रेबेका को वापस चलाने जा रहा हूं ताकि उनमें से कुछ के माध्यम से चला जाऊं ताकि हम उन तक जल्दी से जल्दी पहुंच सकें। आपका बहुत बहुत धन्यवाद।

रेबेका जोजवाक: धन्यवाद डीज़, और हाँ डेव, हमारे पास दर्शकों से काफी कुछ सवाल हैं। और अपनी अंतर्दृष्टि के लिए डीज़ और रॉबिन को भी धन्यवाद। मुझे पता है कि इस विशेष प्रतिभागी को घंटे के शीर्ष पर सही छोड़ना था, लेकिन वह पूछ रहा है कि क्या आप देखते हैं कि सूचना प्रणाली विभाग उपकरणों को प्रदान करने में सहज होने के बजाय परिष्कृत डेटा नियंत्रणों पर अधिक प्राथमिकता देते हैं। ज्ञान कार्यकर्ताओं? मेरा मतलब है, वह है - आगे बढ़ो।

डेविड स्वीनर: हाँ, मुझे लगता है कि यह संगठन पर निर्भर करता है। मुझे लगता है कि एक बैंक, एक बीमा कंपनी, शायद उनकी अलग-अलग प्राथमिकताएं और काम करने के तरीके, बनाम एक विपणन संगठन हैं। मुझे लगता है कि मुझे यह कहना होगा कि यह केवल उद्योग पर निर्भर करता है और आप देख रहे हैं। विभिन्न उद्योगों में अलग-अलग फोकस और जोर होता है।

रेबेका जोजवाक: अच्छा ठीक है, यह समझ में आता है। और फिर एक और सहभागी ने जानना चाहा, स्टैटिस्टिका के पीछे का इंजन क्या है? क्या यह सी ++ या आपका अपना सामान है?

डेविड स्वीनर: ठीक है, मुझे नहीं पता कि क्या मैं इसके साथ उस विशिष्ट को प्राप्त कर सकता हूं जो कि लगभग 30 वर्षों से है और इसे मेरे समय से पहले विकसित किया गया था लेकिन विश्लेषणात्मक एल्गोरिदम का एक मुख्य पुस्तकालय है जो स्टेटिस्टिका एल्गोरिदम है जो चलता है। और आपने यहां देखा कि हम R को भी चला सकते हैं, हम पायथन को चला सकते हैं, हम Azure को फोड़ सकते हैं, हम H2O पर स्पार्क पर चल सकते हैं, इसलिए मुझे लगता है कि मुझे उस प्रश्न का उत्तर देना होगा, यह विभिन्न प्रकार के इंजन हैं। और आप किस एल्गोरिथम को चुनते हैं, इसके आधार पर, यदि यह एक स्टेटिस्टिका है, तो यह इस तरह से चलता है, यदि आप H2O और स्पार्क में से किसी एक को चुनते हैं, तो वह इसका उपयोग करता है, और इसलिए यह उनमें से एक किस्म है।

रेबेका जोजवाक: ठीक है अच्छा। एक अन्य सहभागी प्रकार ने विशेष रूप से इस स्लाइड की ओर इशारा करते हुए पूछा, यह जानना चाहते हैं, किस तरह का, नागरिक डेटा वैज्ञानिक कैसे जानता है कि कौन से पुन: प्रयोज्य टेम्पलेट्स का उपयोग करना है? और मुझे लगता है कि मैं उससे एक व्यापक सवाल करना चाहूंगा। कि, आप क्या देख रहे हैं जब लाइन-ऑफ-बिजनेस उपयोगकर्ता या व्यवसाय विश्लेषक आते हैं और वे इन उपकरणों का उपयोग करना चाहते हैं, तो उन्हें चुनना और चलाना कितना आसान है?

डेविड स्वीनर: मुझे लगता है कि मैं इसका उत्तर दूंगा और यदि आप उपयोग कर सकते हैं, यदि आप विंडोज से परिचित हैं, तो यह विंडोज-आधारित प्लेटफॉर्म है, इसलिए मैंने इन स्क्रीनशॉट के शीर्ष को काट दिया, लेकिन इसे विंडोज रिबन मिला। लेकिन वे कैसे जानते हैं कि किस वर्कफ़्लो का उपयोग करना है? यह विंडोज एक्सप्लोरर की तरह दिखता है, इसलिए एक पेड़ की संरचना है और आप इसे कॉन्फ़िगर कर सकते हैं और इसे सेट कर सकते हैं हालांकि आपका संगठन इसे स्थापित करना चाहता है। लेकिन यह हो सकता है, आपके पास बस ये फ़ोल्डर हों और आप इन फ़ोल्डरों के भीतर पुन: प्रयोज्य टेम्पलेट डाल दें। और मुझे लगता है कि आपकी कंपनी शायद ही कोई नामकरण कर सकती है, यहां "जोखिम प्रोफ़ाइल की गणना करें," यहां "इन स्रोतों से डेटा प्राप्त करें" और आप जो चाहें उन्हें नाम दें। यह एक निशुल्क फ़ोल्डर है, आप बस अपने कैनवास पर नोटों को बाहर खींचें। तो, बहुत आसान है।

रेबेका जोजवाक: ठीक है अच्छा। शायद अगली बार एक डेमो। फिर एक अन्य सहभागी की उपस्थिति बढ़ती है, और यह वही है जो आप और रॉबिन और डीज़ के बारे में बात कर रहे थे, जहां तक ​​कि अशुद्धियों के बारे में, विशेष रूप से एक स्प्रेडशीट पर, लेकिन कचरा / कचरा बाहर, और वह इसे तब और अधिक महत्वपूर्ण होने के रूप में देखता है जब यह आता है विश्लेषण के लिए। यह उल्लेख करने की तरह, आप जानते हैं, डेटा का दुरुपयोग वास्तव में कुछ दुर्भाग्यपूर्ण निर्णय ले सकता है। और वह सोच रहा है कि अधिक असफल कैफे एल्गोरिदम के विकास पर आपके विचार क्या हैं, मुझे लगता है कि वह शब्द का उपयोग करता है, एनालिटिक्स के "अति उत्साही" शब्द का उपयोग करता है। आप जानते हैं, कोई व्यक्ति आता है, वे वास्तव में उत्साहित हो जाते हैं, वे इन उन्नत एनालिटिक्स को करना चाहते हैं, वे इन उन्नत एल्गोरिदम को चलाना चाहते हैं, लेकिन शायद वे निश्चित नहीं हैं। तो आप उसके खिलाफ किस तरह की सुरक्षा करते हैं?

डेविड स्वीनर: हाँ, इसलिए मुझे लगता है कि मैं इसका उत्तर सबसे अच्छा मैं दे सकता हूं, लेकिन मुझे लगता है कि सब कुछ लोगों, प्रक्रिया और प्रौद्योगिकी के लिए नीचे आता है। हमारे पास ऐसी तकनीक है जो लोगों को सक्षम करने में मदद करती है और जो भी प्रक्रिया आप अपने संगठन में डालना चाहते हैं उसे सक्षम करने में मदद करती है। किसी को कूपन के उदाहरण में, शायद यह उतना महत्वपूर्ण नहीं है, और यदि यह डिजिटल है तो इसकी वास्तव में कोई कीमत नहीं है, शायद सुरक्षा नियंत्रण का एक स्तर है और शायद हम परवाह नहीं करते हैं। अगर मैं सर्जिकल साइट संक्रमण की भविष्यवाणी कर रहा हूं, तो शायद मैं इसके बारे में थोड़ा और सावधान रहना चाहता हूं। या अगर मैं दवा की गुणवत्ता और सुरक्षा और उस तरह की चीजों की भविष्यवाणी कर रहा हूं, तो शायद मैं इसके बारे में थोड़ा और सावधान रहना चाहता हूं। आप सही हैं, कचरा / कचरा बाहर निकालते हैं, इसलिए हम जो करने की कोशिश करते हैं, वह एक ऐसा मंच प्रदान करता है जो आपको अपने संगठन को जो भी प्रक्रिया अपनाना चाहता है, उसे दर्ज़ करने की अनुमति देता है।

रेबेका जोजवाक: ठीक है अच्छा। मेरे पास कुछ और प्रश्न हैं, लेकिन मुझे पता है कि हम इस समय से काफी पहले चले गए हैं और मैं सिर्फ अपने प्रस्तुतकर्ताओं को बताना चाहता हूं, यह बहुत बढ़िया था। और हम डेल स्टेटिस्टिका से डेव स्वीनर को बहुत धन्यवाद देना चाहते हैं। बेशक, डॉ। रॉबिन ब्लोर और डीज़ ब्लांचफील्ड, आज विश्लेषकों होने के लिए धन्यवाद। हम अगले महीने डेल स्टेटिस्टिका के साथ एक और वेबकास्ट करने जा रहे हैं। मुझे पता है कि डेव ने इस विषय के बारे में संकेत दिया था। यह किनारे पर विश्लेषिकी के बारे में होगा, एक और आकर्षक विषय, और मुझे पता है कि इस वेबकास्ट पर कुछ बहुत ही आकर्षक उपयोग के मामलों पर चर्चा होने वाली है। यदि आपको पसंद आया तो आपने आज देखा, अगले महीने के लिए वापस आएँ। और इसके साथ, दोस्तों, मैं आपको विदाई देता हूं। बहुत बहुत धन्यवाद। अलविदा।