10 बिग डेटा डू और डॉनट्स

लेखक: Eugene Taylor
निर्माण की तारीख: 13 अगस्त 2021
डेट अपडेट करें: 8 मई 2024
Anonim
Varalakshmi M M_Collection and transmission of big data
वीडियो: Varalakshmi M M_Collection and transmission of big data

विषय



स्रोत: Rawpixelimages / Dreamstime.com

ले जाओ:

अधिकांश कंपनियों के लिए बड़ा डेटा एक नया और उभरता हुआ डोमेन है। इसे काम करने के लिए सावधानीपूर्वक ठीक-ट्यूनिंग और सर्वोत्तम प्रथाओं का उपयोग करना चाहिए।

बिग डेटा सभी प्रकार के उद्योगों के लिए बहुत सारे वादे करता है। यदि यह बड़ा डेटा प्रभावी रूप से और कुशलता से प्राप्त किया जाता है, तो यह निर्णय लेने और विश्लेषण में महत्वपूर्ण प्रभाव डाल सकता है। लेकिन बड़े डेटा का लाभ तभी प्राप्त किया जा सकता है जब इसे संरचित तरीके से प्रबंधित किया जाए। बड़े डेटा की सर्वोत्तम प्रथाओं को धीरे-धीरे स्थापित किया जा रहा है, लेकिन कार्यान्वयन के लिए पहले से ही कुछ स्पष्ट डॉस और डॉनट्स नहीं हैं।

निम्नलिखित मार्गदर्शन वास्तविक जीवन की परियोजनाओं से प्राप्त व्यावहारिक अनुभव और ज्ञान पर आधारित है। यहाँ मेरे शीर्ष बड़े डेटा डॉस और डॉट्स हैं।

एक बड़ी डेटा पहल में सभी व्यावसायिक वर्गों को शामिल करें

एक बड़ी डेटा पहल एक अलग और स्वतंत्र गतिविधि नहीं है, और सभी व्यावसायिक इकाइयों की भागीदारी वास्तविक मूल्य और अंतर्दृष्टि प्राप्त करने के लिए आवश्यक है। बड़ा डेटा संगठनों को डेटा की बड़ी मात्रा का लाभ उठाने और ग्राहक के व्यवहार, घटनाओं, रुझानों, भविष्यवाणियों आदि में अंतर्दृष्टि प्राप्त करने में मदद कर सकता है। यह डेटा स्नैपशॉट के साथ संभव नहीं है, जो केवल बड़े डेटा में संसाधित डेटा की संपूर्ण मात्रा का एक हिस्सा कैप्चर करता है। नतीजतन, कंपनियां सही पैटर्न को समझने के लिए सभी संभावित रास्ते / व्यावसायिक इकाइयों से आने वाले सभी प्रकार के डेटा पर अधिक ध्यान केंद्रित कर रही हैं।

बड़े डेटा कार्यान्वयन के लिए सभी बुनियादी ढांचे के मॉडल का मूल्यांकन करें

डेटा की मात्रा और इसका प्रबंधन किसी भी बड़ी डेटा पहल के लिए एक प्रमुख चिंता का विषय है। क्योंकि बड़ा डेटा डेटा के पेटाबाइट्स से संबंधित है, इसे प्रबंधित करने का एकमात्र समाधान डेटा केंद्रों का उपयोग करके है। साथ ही, किसी भी संग्रहण सुविधा को चुनने और अंतिम रूप देने से पहले लागत घटक पर विचार करना होगा। क्लाउड सेवाएं अक्सर सबसे अच्छा विकल्प होती हैं, लेकिन उपयुक्त को निर्धारित करने के लिए विभिन्न क्लाउड वातावरण की सेवाओं का मूल्यांकन किया जाना चाहिए। चूंकि भंडारण किसी भी बड़े डेटा कार्यान्वयन में सबसे महत्वपूर्ण घटकों में से एक है, यह एक ऐसा कारक है जिसका मूल्यांकन किसी भी बड़ी डेटा पहल में बहुत सावधानी से किया जाना चाहिए। (टोडेज़ बिग डेटा चैलेंज स्टाइम्स इन वेराइटी, नॉट वॉल्यूम या वेलोसिटी से एक और परिप्रेक्ष्य प्राप्त करें।)

बड़ी डेटा योजना में पारंपरिक डेटा स्रोतों पर विचार करें

बड़े डेटा के विभिन्न स्रोत हैं और स्रोतों की संख्या भी दिन-प्रतिदिन बढ़ रही है। डेटा की इस विशाल मात्रा का उपयोग बड़े डेटा प्रोसेसिंग के इनपुट के रूप में किया जाता है। नतीजतन, कुछ कंपनियों को लगता है कि पारंपरिक डेटा स्रोतों का कोई फायदा नहीं है। यह सच नहीं है, क्योंकि यह पारंपरिक डेटा किसी भी बड़ी डेटा स्टोरी की सफलता के लिए एक महत्वपूर्ण घटक है। पारंपरिक डेटा में बहुमूल्य जानकारी होती है, इसलिए इसका उपयोग अन्य बड़े डेटा स्रोतों के साथ किया जाना चाहिए। बड़े डेटा का वास्तविक मूल्य केवल तभी प्राप्त किया जा सकता है जब सभी डेटा स्रोतों (पारंपरिक और गैर-पारंपरिक) को ध्यान में रखा जाए। (टेक दैट, बिग डेटा में अधिक जानें! छोटा डेटा क्यों बड़ा पंच पैक कर सकता है।)

डेटा के एक सुसंगत सेट पर विचार करें

एक बड़े डेटा वातावरण में, डेटा विभिन्न स्रोतों से आ रहा है। डेटा का प्रारूप, संरचना और प्रकार एक स्रोत से दूसरे में भिन्न होते हैं। सबसे महत्वपूर्ण हिस्सा यह है कि जब आपके बड़े डेटा वातावरण की बात आती है तो डेटा को साफ़ नहीं किया जाता है। इसलिए, इससे पहले कि आप आने वाले डेटा पर भरोसा करें, आपको पुनरावृत्ति अवलोकन और विश्लेषण द्वारा स्थिरता की जांच करने की आवश्यकता है। एक बार डेटा की संगति की पुष्टि हो जाने के बाद, इसे मेटाडेटा के लगातार सेट के रूप में माना जा सकता है। पैटर्न के सावधानीपूर्वक अवलोकन द्वारा मेटाडेटा का लगातार सेट ढूंढना किसी भी बड़ी डेटा योजना में एक आवश्यक अभ्यास है।

डेटा वितरित करते हैं

जब हम प्रसंस्करण पर्यावरण पर विचार करते हैं तो डेटा की मात्रा एक प्रमुख चिंता का विषय है। डेटा की बड़ी मात्रा के कारण जो बड़े डेटा से संबंधित है, एकल सर्वर पर प्रसंस्करण संभव नहीं है। समाधान एक Hadoop वातावरण है, जो एक वितरित कंप्यूटिंग वातावरण है जो कमोडिटी हार्डवेयर पर चलता है। यह कई नोड्स पर तेजी से प्रसंस्करण की शक्ति देता है। (Hadoop के बारे में जानने के लिए 7 बातों में और जानें।)

कभी भी एक बड़े डेटा एनालिटिक्स दृष्टिकोण पर भरोसा मत करो

बड़े डेटा को संसाधित करने के लिए बाजार में विभिन्न प्रौद्योगिकियां उपलब्ध हैं। सभी बड़ी डेटा तकनीकों का आधार अपाचे हडोप और मैपरेड है। इसलिए, सही उद्देश्य के लिए सही तकनीक का मूल्यांकन करना महत्वपूर्ण है। कुछ महत्वपूर्ण एनालिटिक्स दृष्टिकोण भविष्य कहनेवाला एनालिटिक्स, प्रिस्क्रिप्टिव एनालिटिक्स, एनालिटिक्स, स्ट्रीम डेटा एनालिटिक्स आदि हैं। वांछित लक्ष्य को प्राप्त करने के लिए उचित विधि / दृष्टिकोण का चयन महत्वपूर्ण है। एकल दृष्टिकोण पर भरोसा करने से बचने के लिए इसका सबसे अच्छा है, लेकिन विभिन्न दृष्टिकोणों की जांच करना और अपने समाधान के लिए सही मैच का चयन करना है।

तैयार होने से पहले बड़ी डेटा पहल शुरू न करें

किसी भी बड़ी डेटा पहल के लिए हमेशा छोटे कदमों के साथ शुरुआत करने की सिफारिश की जाती है। इसलिए, विशेषज्ञता हासिल करने के लिए पायलट परियोजनाओं के साथ शुरू करें और फिर वास्तविक कार्यान्वयन के लिए जाएं। बड़े डेटा की क्षमता बहुत प्रभावशाली है, लेकिन वास्तविक मूल्य केवल तभी प्राप्त किया जा सकता है जब हम अपनी गलतियों को कम करते हैं और अधिक विशेषज्ञता हासिल करते हैं।

अलगाव में डेटा का उपयोग न करें

बड़े डेटा स्रोत हमारे चारों ओर बिखरे हुए हैं और वे दिन-प्रतिदिन बढ़ रहे हैं। सही एनालिटिक्स आउटपुट प्राप्त करने के लिए इन सभी डेटा को एकीकृत करना महत्वपूर्ण है। डेटा एकीकरण के लिए बाजार में विभिन्न उपकरण उपलब्ध हैं, लेकिन उनका उपयोग करने से पहले ठीक से मूल्यांकन किया जाना चाहिए। बड़े डेटा का एकीकरण एक जटिल कार्य है क्योंकि विभिन्न स्रोतों के डेटा अलग-अलग प्रारूप के होते हैं, लेकिन अच्छे विश्लेषण परिणाम प्राप्त करने के लिए इसकी बहुत आवश्यकता होती है।

डेटा सुरक्षा की अनदेखी न करें

डेटा सुरक्षा बड़ी डेटा योजना में एक प्रमुख विचार है। प्रारंभ में, (किसी भी प्रसंस्करण करने से पहले), डेटा पेटाबाइट्स में है, इसलिए सुरक्षा को सख्ती से लागू नहीं किया गया है। लेकिन कुछ प्रसंस्करण के बाद, आपको डेटा का एक सबसेट मिलेगा जो कुछ अंतर्दृष्टि प्रदान करता है। इस बिंदु पर, डेटा सुरक्षा आवश्यक हो जाती है। जितना अधिक डेटा संसाधित और ठीक ट्यून किया जाता है, उतना ही मूल्यवान यह अक्सर एक संगठन के लिए बन जाता है। यह ठीक ट्यून्ड आउटपुट डेटा बौद्धिक संपदा है और इसे सुरक्षित किया जाना चाहिए। डेटा सुरक्षा को बड़े डेटा जीवन चक्र के एक भाग के रूप में लागू किया जाना चाहिए।

बड़े डेटा एनालिटिक्स के प्रदर्शन भाग को अनदेखा न करें

बड़े डेटा एनालिटिक्स का आउटपुट केवल तभी उपयोगी होता है जब वह अच्छा प्रदर्शन देता है। बड़ी डेटा एक तेज गति से डेटा की एक बड़ी राशि के प्रसंस्करण के आधार पर अधिक अंतर्दृष्टि प्रदान करती है। इसलिए, इसे प्रभावी ढंग से और कुशलता से प्रबंधित करना आवश्यक है। यदि बड़े डेटा के प्रदर्शन को सावधानी से प्रबंधित नहीं किया जाता है, तो यह समस्याओं का कारण होगा और पूरे प्रयास को अर्थहीन बना देगा।

हमारी चर्चा में, हमने बड़े डेटा पहलों के डॉस और डॉट्स पर ध्यान केंद्रित किया है। बिग डेटा एक उभरता हुआ क्षेत्र है और जब इसे लागू करने की बात आती है, तो कई कंपनियां अभी भी योजना के चरण में हैं। जोखिम और गलतियों को कम करने के लिए बड़े डेटा सर्वोत्तम प्रथाओं को समझना आवश्यक है। चर्चा बिंदु लाइव प्रोजेक्ट के अनुभवों से लिए गए हैं, इसलिए यह एक बड़ी डेटा रणनीति को सफल बनाने के लिए कुछ दिशानिर्देश देगा।