बिग डेटा के प्रबंधन के बारे में 6 बड़े मिथक

लेखक: Eugene Taylor
निर्माण की तारीख: 15 अगस्त 2021
डेट अपडेट करें: 22 जून 2024
Anonim
बिग डेटा के बारे में 7 घातक मिथक, भाग 6
वीडियो: बिग डेटा के बारे में 7 घातक मिथक, भाग 6

विषय


स्रोत: ड्वेनल्ड777 / ड्रीमस्टाइम डॉट कॉम

ले जाओ:

बड़ा डेटा बड़ा व्यवसाय है, लेकिन केवल अगर इसका ठीक से उपयोग किया जाए।

मई 2014 में वापस, फॉरेस्टर रिसर्च ने बड़े डेटा के आसपास प्रचार के बारे में कुछ निष्कर्ष निकालते हुए दो रिपोर्ट जारी की। शोध फर्म ने 250 से अधिक विपणन और व्यवसाय-विकास अधिकारियों का सर्वेक्षण किया। रिपोर्टों के लेखकों के अनुसार, बड़े डेटा बयानबाजी एक सर्वकालिक उच्च पर है, और प्रौद्योगिकी विक्रेता अविश्वसनीय दावों के साथ उत्पादों का दोहन कर रहे हैं।

गार्टनर फॉरेस्टर रिसर्च से सहमत हैं; पर्याप्त प्रचार बड़े डेटा को घेर लेता है। सितंबर 2014 की रिपोर्ट में, गार्टनर ने सबसे बड़े डेटा मिथकों में से पांच का विमोचन किया, और गार्टनर विश्लेषकों ने बड़े डेटा और इसके हेरफेर के बारे में क्या गलतफहमी के रूप में अपनी राय पेश की। तो क्या बड़े डेटा सबसे बड़े मिथक हैं? चलो देखते हैं।

मिथक: बड़े डेटा को अपनाने में हर कोई हमसे आगे है।

गार्टनर का कहना है कि बड़े डेटा में रुचि एक सर्वकालिक उच्च पर है। इसके बावजूद, मतदान में शामिल 13 प्रतिशत लोगों के पास कार्य प्रणाली है। कारण: अधिकांश कंपनियों ने अभी तक यह पता नहीं लगाया है कि डेटा के बड़े भंडार से किसी भी मूल्य को कैसे प्राप्त किया जाए। यहां, गार्टनर का सर्वेक्षण फॉरेस्टर रिपोर्ट की तुलना में अधिक आशावादी है, जिसमें पाया गया कि सर्वेक्षण के केवल 9 प्रतिशत प्रतिभागियों ने कहा कि उन्होंने अगले वर्ष में बड़े-डेटा तहखाने को लागू करने की योजना बनाई है। (बड़ा डेटा देने के लिए बहुत कुछ है। 5 वास्तविक दुनिया की समस्याओं में और जानें बड़े डेटा हल कर सकते हैं।)

मिथक: हमारे पास इतना डेटा है; हमें हर छोटे डेटा दोष के बारे में चिंता करने की आवश्यकता नहीं है।

गार्टनर हमारे पास मौजूद एक इंसान के बारे में चिंतित है: "हमारे पास बहुत कुछ है, जो थोड़ा बुरा नहीं है।" टार्ट फ्राइडमैन, उपाध्यक्ष और गार्टनर के प्रतिष्ठित विश्लेषक का मानना ​​है कि स्थिति को देखने का यह गलत तरीका है।

"वास्तव में, हालांकि प्रत्येक व्यक्तिगत दोष का पूरे डेटासेट पर बहुत कम प्रभाव पड़ता है, जितना कि कम डेटा होने पर होता है, पहले की तुलना में अधिक दोष हैं क्योंकि अधिक डेटा है," फ्राइडमैन ने कहा। "इसलिए, संपूर्ण डेटासेट पर खराब-गुणवत्ता वाले डेटा का समग्र प्रभाव समान रहता है।"

फ्राइडमैन चिंता का एक और कारण जोड़ता है। बिग-डेटा कैप्चर में अक्सर व्यवसाय के बाहर से डेटा शामिल होता है, जो कि अज्ञात संरचना और उत्पत्ति का है। इससे त्रुटियों की संभावना बढ़ जाती है।

मिथक: बिग डेटा तकनीक डेटा एकीकरण की आवश्यकता को समाप्त कर देगी।

दो प्रमुख डेटा विश्लेषण रणनीतियाँ हैं जो बड़े डेटा पर लागू हो सकती हैं: "लिखने पर स्कीमा" या "रीड पर स्कीमा।" कुछ समय पहले तक, लिखने पर स्कीमा केवल एक ही तरीका था। पढ़ने पर स्कीमा डेटाबेस प्रबंधन में वर्तमान सनक है। स्कीमा ऑन लिखने के विपरीत, जिसके लिए एक संरचित प्रारूप की आवश्यकता होती है, डेटा को अपने कच्चे प्रारूप में स्कीमा-ऑन-रीड डेटाबेस में लोड किया जाता है। तब डेवलपर्स - Hadoop जैसे असंरचित डेटाबेस प्लेटफार्मों का उपयोग करते हुए - एक संक्षिप्त प्रारूप में असमान डेटा को मोड़ते हैं। पढ़ने पर स्कीमा के स्पष्ट लाभ हैं लेकिन, गार्टनर का उल्लेख है, कुछ बिंदु पर डेटा एकीकरण होना है।

मिथक: उन्नत विश्लेषण के लिए डेटा वेयरहाउस का उपयोग करना व्यर्थ है।

डेटा वेयरहाउस बनाने के लिए समय बिताना कई सूचना प्रबंधकों के लिए व्यर्थ लगता है, खासकर जब नए-कैप्चर किए गए डेटा डेटा वेयरहाउस में इससे अलग होते हैं। हालांकि, गार्टनर फिर से चेतावनी देता है कि उन्नत डेटा एनालिटिक्स डेटा वेयरहाउस और नए डेटा का उपयोग करेंगे, जिसका अर्थ है कि डेटा इंटीग्रेटर्स को होना चाहिए:
  • विश्लेषण के लिए उन्हें उपयुक्त बनाने के लिए नए डेटा प्रकारों को परिष्कृत करें
  • तय करें कि कौन सा डेटा प्रासंगिक है, और डेटा गुणवत्ता का स्तर आवश्यक है
  • निर्धारित करें कि डेटा को कैसे एकत्रित किया जाए
  • यह समझें कि डेटा परिशोधन डेटा वेयरहाउस के अलावा अन्य स्थानों पर भी हो सकता है

मिथक: डेटा झील डेटा वेयरहाउस की जगह लेगी।

डेटा लेयर्स असमान डेटा की रिपॉजिटरी हैं, डेटा वेयरहाउस के विपरीत, जहाँ डेटा एक संरचित प्रारूप में है। डेटा वेयरहाउस बनाने की तुलना में डेटा लेक बनाने में थोड़ी मेहनत (डेटा फॉर्मेट करने की आवश्यकता नहीं) होती है, यही वजह है कि डेटा झीलें रुचि रखती हैं।

गार्टनर इस बात पर जोर देते हैं कि डेटा होना बिंदु नहीं है - सूचित निर्णय के लिए कैप्चर किए गए डेटा में हेरफेर करने में सक्षम होना बिंदु है। इसके अलावा, निर्णय लेने की सुविधा के लिए (कुछ हद तक अप्रमाणित) डेटा झीलों का उपयोग करना समस्याग्रस्त है।

गार्टनर के शोध निदेशक निक हेडेकर ने कहा, "डाटा वेयरहाउस में पहले से ही एक संगठन में उपयोगकर्ताओं की व्यापक विविधता का समर्थन करने की क्षमता है।" "सूचना-प्रबंधन के नेताओं को डेटा झीलों को पकड़ने के लिए इंतजार नहीं करना पड़ता है।" (बड़े चीजों को अपनाने से पहले जानें 7 चीजें जिन्हें आपको अपनाने से पहले बड़े डेटा के बारे में पता होना चाहिए।)

बिग डेटा वर्क्स - नए डेटा हेरफेर के तरीके मई नहीं

गार्टनर ने कहा कि "बिग-डेटा मिथकों" के बजाय "सबसे बड़ा डेटा मिथक" रिपोर्ट पढ़ने के बाद स्पष्ट हो जाता है। गार्टनर बड़े डेटा का लेयर नहीं है। गार्टनर उन लोगों की लेरी है जो महसूस करते हैं कि बड़े डेटा में हेरफेर करने के नए तरीके "प्राइम टाइम" के लिए तैयार हैं।