विभिन्न डेटा चुनौती उपजी विविधता, मात्रा या वेग से नहीं

लेखक: Judy Howell
निर्माण की तारीख: 28 जुलाई 2021
डेट अपडेट करें: 22 जून 2024
Anonim
High Density 2022
वीडियो: High Density 2022

विषय


ले जाओ:

बहुत से आईटी विभाग डेटा की मात्रा और वेग के मुद्दों पर अपना सब कुछ फेंक देते हैं, डेटा की विविधता के मूलभूत मुद्दे को संबोधित करना भूल जाते हैं।

गार्टनर के अनुसंधान उपाध्यक्ष डौग लैने के अनुसार, बड़े डेटा को प्रबंधित करने और उसका लाभ उठाने की चुनौती तीन तत्वों से आती है। लैंनी ने पहली बार एक दशक से अधिक समय पहले उल्लेख किया था कि बड़ा डेटा उद्यम के लिए ऐसी समस्या है क्योंकि यह हार्ड-टू-मैनेजमेंट वॉल्यूम, वेग और विविधता का परिचय देता है। समस्या यह है कि बहुत से आईटी विभाग डेटा वॉल्यूम और वेग के मुद्दों पर अपना सब कुछ फेंक देते हैं, डेटा की विविधता के मूलभूत मुद्दे को संबोधित करना भूल जाते हैं।

2001 में वापस, लांय ने लिखा कि "प्रमुख उद्यम एक सामान्य व्यवसाय शब्दावली को परिभाषित करने के लिए एक केंद्रीकृत डेटा वेयरहाउस का उपयोग करेंगे जो आंतरिक और बाहरी सहयोग को बेहतर बनाता है।" उस शब्दावली का मुद्दा - और परिवर्तनशीलता जो इसे बनाने से कंपनियों को बचाए रखती है - आज बड़े डेटा कॉनड्रम के कम से कम संबोधित पहलू बनी हुई है। (अन्य विशेषज्ञों का क्या कहना है, इसकी जाँच करें। बिग डेटा विशेषज्ञों का अनुसरण करने के लिए देखें।)


तीन बनाम बड़ा डेटा

कई व्यवसायों ने डेटा की मात्रा और वेग में वृद्धि के तरीकों के बारे में पाया है। , उदाहरण के लिए, डेटा के विशाल मात्रा का विश्लेषण कर सकते हैं। बेशक, उस डेटा को अक्सर एक ही पैरामीटर के भीतर बार-बार प्रस्तुत किया जाता है। इसने प्रौद्योगिकी नवाचारों जैसे स्तंभ डेटाबेस, जो अब व्यापक रूप से अन्य कंपनियों द्वारा उपयोग किए जाते हैं जो समान डेटा आइटम के समान रूप से बड़े आकार के स्टोर का सामना करते हैं।

वेग के नामकरण के संदर्भ में, स्प्लंक मदद उद्यमों जैसे विक्रेताओं लॉग फ़ाइलों के माध्यम से तेजी से बनाए गए डेटा का विश्लेषण करते हैं जो प्रति सेकंड कई हजार घटनाओं को कैप्चर करते हैं। उच्च मात्रा की घटनाओं का यह विश्लेषण सुरक्षा और प्रदर्शन निगरानी उपयोग मामलों पर लक्षित है। डेटा वॉल्यूम चुनौती के साथ, वेग चुनौती को बड़े पैमाने पर परिष्कृत इंडेक्सिंग तकनीकों के माध्यम से संबोधित किया गया है और डेटा एनालिटिक्स को वितरित किया है जो प्रसंस्करण क्षमता को डेटा वेग में वृद्धि करने में सक्षम बनाता है।

जब यह विविधता की बात आती है, हालांकि, बहुत सारे उद्यम अभी भी बड़े डेटा एनालिटिक्स के लिए अपने दृष्टिकोण में एक बड़ी समस्या का सामना करते हैं। यह समस्या तीन कारकों से प्रेरित है: पहला, विकास, अधिग्रहण और तकनीकी नवाचारों के कारण जो पर्यावरण में नई प्रणालियों को जोड़ते हैं, उद्यम अत्यधिक विषम वातावरण में बंद होते हैं और यह विषमता केवल समय के साथ बढ़ती जाती है। उद्यमों को कई प्रकार के सिस्टमों के ढेरों को ट्रैक करने और हजारों डेटा प्रकारों को प्रबंधित करने की आवश्यकता होती है, साथ ही साथ विभिन्न नामकरणों और प्रारूपों का उपयोग करके एक ही डेटा का प्रतिनिधित्व किया जाता है।


दूसरे, ये सिस्टम और डेटा प्रकार कई मामलों में प्रासंगिक जानकारी और सूचना दोनों को रिपोर्ट करते हैं जिन्हें संबोधित समस्या के लिए अप्रासंगिक के रूप में सुरक्षित रूप से फ़िल्टर किया जा सकता है। प्रभावशाली जानकारी को विश्वसनीय ढंग से पहचानने की आवश्यकता है।

विविधता चुनौती का तीसरा आयाम पर्यावरण में निरंतर परिवर्तनशीलता या परिवर्तन है। सिस्टम अपग्रेड किए जाते हैं, नए सिस्टम पेश किए जाते हैं, नए डेटा प्रकार जोड़े जाते हैं और नए नामकरण पेश किए जाते हैं। यह आगे डेटा विविधता चुनौती को वश में करने की हमारी क्षमता को बढ़ाता है। यह विभिन्न चुनौती के लिए एक अतिरिक्त परत जोड़ता है। (अधिक जानकारी के लिए, बिग डेटा की जाँच करें: यह कैसे कैप्चर किया गया, क्रंच किया गया और व्यावसायिक निर्णय लेने के लिए उपयोग किया गया।)

डेटा विविधता समस्या का समाधान

डेटा विविधता समस्या का समाधान करने के लिए, उद्यमों को आईटी डोमेन के साथ शुरू करना चाहिए, क्योंकि यह अक्सर सबसे खराब अपराधियों और विभिन्न प्रकार की समस्या के सबसे खराब पीड़ितों का प्रतिनिधित्व करता है। पहला कदम सभी आईटी तत्वों या परिसंपत्तियों की एक व्यापक परिभाषा या वर्गीकरण के साथ शुरू करना है। यह आईटी के बारे में या इसके बारे में किसी भी चीज को संदर्भित करने के लिए एक आधार रेखा या नींव प्रदान करता है और उद्यमों को एक ज्ञात वर्गीकरण या शब्दावली के खिलाफ बढ़ती विषमता का प्रबंधन करने में सक्षम बनाता है।

नो बग्स, नो स्ट्रेस - योर स्टेप बाय स्टेप गाइड बाय स्टेप गाइड टू लाइफ-चेंजिंग सॉफ्टवेर विदाउट योर लाइफ

जब कोई भी सॉफ़्टवेयर गुणवत्ता की परवाह नहीं करता है तो आप अपने प्रोग्रामिंग कौशल में सुधार कर सकते हैं।

अगला कदम कई तरीकों की पहचान करना है जो एक ही वस्तु को रिकॉर्ड के विभिन्न प्रणालियों में दर्शाया गया है। यह आईटी पेशेवरों को उनके विषम वातावरण और अत्यधिक फिल्टर को देखने और प्रासंगिक और प्रबंधनीय विखंडू में डेटा को संपीड़ित करने में सक्षम बनाता है।

अंत में, आईटी प्रबंधकों को एक ही तत्व को संदर्भित करने के लिए नए प्रकार के तत्वों को पेश किए जाने या नए नामकरण जैसे परिवर्तनों के लिए पर्यावरण की निरंतर परीक्षा की प्रक्रिया अपनानी चाहिए।

इन कदमों के साथ, आईटी संगठन विभिन्न प्रकार की समस्या का प्रबंधन कर सकते हैं और गहरी अंतर्दृष्टि प्राप्त कर सकते हैं जिन्होंने ऐतिहासिक रूप से आईटी टीमों को हटा दिया है। इसके अलावा, विविधता की समस्या का प्रबंधन करने से उपकरण और तकनीकों में निवेश पर उनकी वापसी में सुधार होता है जो वॉल्यूम और वेग की अधिक पारंपरिक बड़ी डेटा समस्याओं को संबोधित करते हैं।