डेटा कैटलॉग और मशीन लर्निंग मार्केट की परिपक्वता

लेखक: Roger Morrison
निर्माण की तारीख: 28 सितंबर 2021
डेट अपडेट करें: 21 जून 2024
Anonim
मशीन लर्निंग और एआई के लिए डेटा कैसे तैयार करें
वीडियो: मशीन लर्निंग और एआई के लिए डेटा कैसे तैयार करें

विषय


स्रोत: नेमिया / ड्रीमस्टाइम डॉट कॉम

ले जाओ:

MLDC बाजार बढ़ रहा है, और मशीन लर्निंग के साथ बड़े डेटा को प्रभावी ढंग से लाभ उठाने के इच्छुक उद्यमों को क्षेत्र में शीर्ष नामों और उनकी व्यक्तिगत रैंकिंग के बारे में पता होना चाहिए।

यह बड़े डेटा की उम्र है। हम जानकारी के साथ जलमग्न हो जाते हैं, और व्यवसायों को इसके मूल्य को प्रबंधित करने और निकालने की चुनौती मिलती है।

बड़े डेटा के प्रवाह में न केवल मात्रा, विविधता और वेग होता है, बल्कि जटिलता भी होती है। जैसा कि बिग डेटा हिस्ट्री और करंट थिंकिंग में एसएएस द्वारा पहचाना गया है, "कई स्रोतों से धाराओं का एक कारक है, जो पूरे सिस्टम में डेटा को लिंक, मैच, क्लीन और ट्रांसफ़ॉर्म करना मुश्किल बनाता है।" (बड़े डेटा के बारे में अधिक जानना चाहते हैं। बड़ा (बड़ा) डेटा बड़ा भविष्य देखें।)

मूल्यवान अंतर्दृष्टि प्राप्त करना केवल यथासंभव अधिक डेटा एकत्र करने का प्रश्न नहीं है, बल्कि सही डेटा खोजने का भी है। यह असंभव मैनुअल प्रक्रियाओं के साथ यह सब के माध्यम से काम करने के लिए। यही कारण है कि अधिक से अधिक व्यवसाय "डेटा कैटलॉग को डेटा तक पहुंच का लोकतंत्रीकरण करने के लिए बदल रहे हैं, आदिवासी डेटा ज्ञान को जानकारी को क्यूरेट करने, डेटा नीतियों को लागू करने और व्यापार मूल्य के लिए सभी डेटा को जल्दी से सक्रिय करने में सक्षम हैं।"


यह वह जगह है जहाँ डेटा कैटलॉग (कभी-कभी सूचना कैटलॉग के रूप में भी जाना जाता है) चित्र में दर्ज करें। जैसा कि यहां परिभाषित किया गया है, वे "उपयोगकर्ताओं को अपने आवश्यक डेटा स्रोतों का पता लगाने और उनके द्वारा खोजे गए डेटा स्रोतों को समझने के लिए सशक्त बनाते हैं, और साथ ही संगठनों को उनके वर्तमान निवेश से अधिक मूल्य प्राप्त करने में सहायता करते हैं।" यह उन तरीकों में से एक है जो विभिन्न प्रकार के उपयोगकर्ताओं के बीच डेटा तक बहुत अधिक पहुंच को सक्षम करने से है जो इसका उपयोग कर सकते हैं या इसमें योगदान कर सकते हैं।

द इंफोनामिक्स इंपीरियल

2017 के अंत में डेटा कैटलॉग के लिए नाटकीय रूप से बढ़ी हुई मांग को देखते हुए, गार्टनर ने उन्हें "नया काला" करार दिया। वे एक त्वरित और किफायती समाधान के रूप में पहचाने जाने लगे "तेजी से वितरित और अव्यवस्थित डेटा परिसंपत्तियों को सूचीबद्ध करने और उनकी सूचना आपूर्ति श्रृंखलाओं को मैप करने के लिए संगठनों को वर्गीकृत करना।" इसके लिए आवश्यकता "इन्फिनॉमिक्स" के उदय के कारण पैदा हुई है, जो सूचना को ट्रैक करने के लिए समान सावधानी को लागू करने का आह्वान करता है, जैसा कि अन्य व्यावसायिक परिसंपत्तियों के प्रबंधन के लिए करता है। (आपूर्ति श्रृंखलाओं पर अधिक जानकारी के लिए, देखें कि मशीन लर्निंग कैसे आपूर्ति श्रृंखला क्षमता में सुधार कर सकती है।)


गार्टर फॉरबस्टर वेव ™: मशीन लर्निंग डेटा कैटलॉग, Q2 2018 के साथ जीब लेते हैं। उस रिपोर्ट में आधे से अधिक सर्वेक्षण प्रतिभागियों ने कहा कि वे अपने डेटा कैटलॉग कार्यान्वयन के निर्माण पर योजना बना रहे थे। संभवतः वे इस तथ्य से काफी हद तक प्रेरित थे कि प्रत्येक के संगठन में कम से कम सात डेटा झीलें थीं। जैसा कि गार्टनर डेटा कैटलॉग पर बताता है, डेटा कैटलॉग विशेष रूप से "डेटा के कोन, अर्थ और मूल्य" को बाहर निकालने के लिए उपयोगी होते हैं, जो आमतौर पर डेटा झील में एक अवर्गीकृत रूप में छोड़ दिया जाता है।

फॉरेस्टर की रिपोर्ट है कि 2017 में 1,000TB या उससे अधिक डेटा के साथ एक तिहाई से अधिक डेटा और एनालिटिक्स निर्णय लेने वाले एक साल पहले केवल 10 से 14 प्रतिशत के बीच रिपोर्ट किए गए थे। उस पैमाने पर डेटा का प्रबंधन एक बढ़ती चुनौती है, या विशेष रूप से, दो चुनौतियां हैं:

") विश्लेषण के लिए मौजूदा व्यावसायिक प्रक्रियाओं को स्रोत डेटा में विलय करना और इनसाइट्स को लागू करना और 2) डेटा बढ़ने पर सोर्स करना, इकट्ठा करना, प्रबंधित करना और नियंत्रित करना।"

नो बग्स, नो स्ट्रेस - योर स्टेप बाय स्टेप गाइड बाय स्टेप गाइड टू लाइफ-चेंजिंग सॉफ्टवेर विदाउट योर लाइफ

जब कोई भी सॉफ़्टवेयर गुणवत्ता की परवाह नहीं करता है तो आप अपने प्रोग्रामिंग कौशल में सुधार कर सकते हैं।

डेटा कैटलॉग व्यवसायों के लिए क्या कर सकते हैं

गार्टनर विशिष्ट तरीकों की पहचान करता है जिसमें डेटा कैटलॉग सूचना और उत्पादकता के प्रवाह में सुधार कर सकते हैं:

  • संगठन के लिए उपलब्ध अप-टू-डेट सूचना परिसंपत्ति सूची को संप्रेषित और संप्रेषित करना।

  • व्यावसायिक शब्दावली की सामान्य शब्दावली का निर्माण करना जो कि संगठनों की डेटा की अर्थपूर्ण व्याख्या और अर्थ को परिभाषित करता है, जिससे मध्यस्थता और निश्चित विसंगतियों को हल करने के लिए साधन उपलब्ध होते हैं।

  • व्यापार और आईटी सहयोगियों को डेटा, दस्तावेज़ और साझा करने के लिए सक्षम करने के लिए एक गतिशील और चुस्त सहयोगात्मक वातावरण सक्षम करना।

  • वंश और प्रभाव विश्लेषण के साथ डेटा उपयोग पारदर्शिता प्रदान करना।

  • सूचना शासन प्रक्रियाओं के समर्थन में डेटा की निगरानी, ​​लेखा परीक्षा और अनुरेखण।

  • डेटा उपयोग और पुन: उपयोग, क्वेरी ऑप्टिमाइज़ेशन और डेटा प्रमाणन के आंतरिक विश्लेषण को बढ़ाने के लिए मेटाडेटा कैप्चर करना।

  • कैप्चरिंग, संचार और विश्लेषण करके जानकारी प्राप्त करना कि डेटा कहाँ मौजूद है, कहाँ से आता है, किस कॉन्टेस्ट में इसका उपयोग किया जाता है, इसकी आवश्यकता क्यों है, यह प्रक्रियाओं और प्रणालियों के बीच कैसे बहता है, इसके लिए कौन जिम्मेदार है, इसका क्या अर्थ है और इसका क्या मूल्य है।

संगठन में प्रमुख लोगों के लिए डेटा की सही पहचान और पहुंच महत्वपूर्ण है, गार्टनर की रिपोर्ट कहती है, न कि केवल "डिजिटल व्यापार परिणामों के लिए डेटा परिसंपत्तियों का मुद्रीकरण करने का तरीका" खोजने के लिए, बल्कि नियमों का पालन करने के लिए, चाहे वे उद्योग हों- स्वास्थ्य बीमा पोर्टेबिलिटी और जवाबदेही अधिनियम (HIPAA) या सामान्य डेटा संरक्षण विनियमन (GDPR) की तरह अधिक सामान्य प्रकृति की तरह।

मशीन लर्निंग में जोड़ना

लेकिन कुछ भी इसकी कमियों के बिना नहीं है। डेटा कैटलॉग के लिए, समस्या धीमी और थकाऊ प्रक्रिया है, जो मैन्युअल रूप से उन सभी मेटाडेटा के साथ बना रही है जिन्हें जगह में रखने की आवश्यकता है। यहीं मशीन लर्निंग कंपोनेंट आता है।

फॉरेस्टर द्वारा मूल्यांकन किए गए डेटा कैटलॉग को MLDCs कहा जाता है क्योंकि वे एआई के घटकों में से एक, मशीन लर्निंग की शक्ति का उपयोग करते हैं। जैसा कि एक पोडियम डेटा ब्लॉग ने समझाया, "मेटाडेटा के लगातार भंडार का निर्माण करना संभव है और फिर एमएल / एआई को फेर्रेट करने और अंतर्निहित डेटा परिसंपत्तियों के आसपास संभावित उपयोगी अंतर्दृष्टि को उजागर करने के लिए संभव बनाता है।"

कैसे चुनाव करें

संगठनों को यह आकलन करने में मदद करने के लिए कि कौन से व्यवसायों का चयन करना चाहिए, फॉरेस्टर ने मूल्यांकन के 29 बिंदुओं को शीर्ष 12 MLDCs पर लागू किया। इसने इस बाजार में नेताओं की पहचान की: आईबीएम, रिलितो, यूनीफी सॉफ्टवेयर, एलेशन और कॉलीबरा। इसमें पाए जाने वाले मजबूत कलाकार इंफॉर्मेटिका, ओरेकल, वॉटरलाइन डेटा, इंफ़ोगिक्स, कैम्ब्रिज सेमेंटिक्स और क्लाउडर हैं। Hortonworks अकेले "दावेदार" की श्रेणी में खड़ा है।

हालांकि, अकेले समग्र रैंकिंग से नहीं जाना चाहिए। रिपोर्ट हर एक की विशेष ताकत और कमजोरियों को तोड़ती है। तदनुसार, यदि एक विशेष सुविधा, जैसे अनुसंधान और विकास, किसी संगठन के लिए अत्यंत महत्वपूर्ण है, तो वह हॉर्टनवर्क्स को उस पहलू के लिए आईबीएम और कोलीब्रा के बराबर मान सकता है क्योंकि वे तीन उस गुणवत्ता के लिए पांच का शीर्ष स्कोर साझा करते हैं, जो कि एलिएशन और कोलोदेरा की तुलना में दो अंक और कैंब्रिज शब्दार्थ से चार अंक बेहतर हैं।

तदनुसार, फॉरेस्टर की रिपोर्ट उन लोगों को सलाह देती है जो अपनी रिपोर्ट का उपयोग मार्गदर्शन के लिए करते हैं ताकि यह सुनिश्चित न हो कि शीर्ष रैंक वाली कंपनी सभी के लिए सर्वोत्तम विकल्प है। उन्हें अपनी विशेष आवश्यकताओं को पूरा करने के लिए मूल्यांकन के टूटने पर पूरा ध्यान देना चाहिए।