5 प्रमुख क्षेत्र जहां बड़ा डेटा एक प्रमुख प्रभाव बना रहा है

वीडियो: मैगनीज एवं तांबा||प्रमुख खनिज नवीनतम डेटा 2019-20 ||उत्पादन ,भंडार एवं उत्पादक क्षेत्र (मैप से)

विषय

ये कैसे हुआ
बड़ा डेटा, बड़ा अवसर
कुछ देखना है

स्रोत: नेमिया / ड्रीमस्टाइम डॉट कॉम

ले जाओ:

हर जगह बड़ा डेटा बड़ा व्यवसाय है, लेकिन कुछ विशिष्ट क्षेत्र इस तकनीक का लाभ उठा रहे हैं।

जब मैंने यह लेख शुरू किया, तो मैं विभिन्न प्रकार के बड़े डेटा प्लेटफ़ॉर्मों को सूचीबद्ध करने की योजना बना रहा था। लेकिन, सभी अलग-अलग बड़े डेटा प्रसादों के संबंध में तीन दिनों के बाद - रिलेशनल बनाम नॉन-रिलेशनल, SQL बनाम NoSQL और डेटाबेस बनाम फ्रेमवर्क - ऑर्डर के कुछ उदाहरणों में, मैंने उस गड़बड़ी से बचने का फैसला किया।

चोट के लिए अपमान को जोड़ने के लिए, मैंने उस व्यक्ति को पेश करने की उम्मीद की थी जिसने लेख के हिस्से के रूप में "बड़े डेटा" शब्द को गढ़ा था। लेकिन, मैं ऐसा नहीं कर सकता। जवाब-सहमति नहीं है। वास्तव में, एक पूर्ण विकसित अनुसंधान परियोजना है जो मूल रूप से बड़े डेटा के साथ आई है। इसके बजाय, Im कुछ प्रमुख तरीकों पर एक नज़र लेने के लिए जा रहा है बड़े डेटा का उपयोग किया जाता है। यह कहीं अधिक महत्वपूर्ण है। और इसके अधिक दिलचस्प और आश्चर्य की बात आप सोच सकते हैं।

ये कैसे हुआ

पारंपरिक डेटा खनन का उपयोग करने वाले विश्लेषक वर्षों से डेटा में हेरफेर कर रहे हैं। इन्हीं विश्लेषकों को अब व्यवसायों, निजी संगठनों और सरकारी एजेंसियों द्वारा बचाई जा रही राशि और डेटा की विविधता का सामना करना मुश्किल हो रहा है।

बड़ा डेटा दर्ज करें, डेटा माइनिंग में अगला विकासवादी कदम। बड़े डेटा को आज के डिजिटल दुनिया में बनाए जा रहे विशाल डेटाबेस और असंख्य प्रकार के डेटा को संभालने के लिए डिज़ाइन किया गया था। यदि "बड़े पैमाने पर" आपके पास Google के बारे में सोच रहा है और यह सभी डेटा एकत्र करता है, तो आप बॉलपार्क में होंगे। आपको आश्चर्य हो सकता है कि Google दुनिया के सबसे बड़े डेटाबेस की शीर्ष दस सूची में केवल चौथे स्थान पर है। जनवरी 2014 तक, वर्ल्ड डेटा सेंटर फॉर क्लाइमेट ने 220 टेराबाइट डेटा के साथ सूची में शीर्ष स्थान प्राप्त किया, और यह किसी का अनुमान है कि कुछ सरकारी एजेंसियों द्वारा नियंत्रित डेटाबेस का आकार।

बेशक, बड़े डेटा ने बंद कर दिया क्योंकि यह बड़ी मात्रा में असमान डेटा में हेरफेर करना संभव बनाता है, और आश्चर्यजनक - और आश्चर्यजनक रूप से विस्तृत और व्यक्तिगत - चीजों की खोज करता है। जॉन सुमेर, मानव संसाधन उद्योग विश्लेषक, निम्नलिखित उदाहरण प्रदान करता है:

"आज हम परिकल्पना बनाते हैं और डेटा एकत्र करते हैं। कल हम उलटा काम करेंगे। डेटा के निरंतर, स्थिर संचय से हम प्रश्न बनाने से पहले डेटा को देख पाएंगे। इसका मतलब है कि हमें उन सवालों के जवाब मिलेंगे जो हमने किए थे। ' t पूछना जानते हैं। हम तथ्यों को मानने वाले चीजों का एक पूरा गुच्छा खोल देंगे। "

बेशक, हम सभी ने उन खौफनाक तरीकों के बारे में सुना है, जिन्हें इस डेटा का उपयोग करने के लिए रखा गया है, जैसे कि टारगेट एक युवा महिला की गर्भावस्था को समझने से पहले गर्भधारण करने की क्षमता। लेकिन बड़े डेटा का उपयोग बहुत कम भयावह कारणों के लिए भी किया जा रहा है। यहां कुछ संगठन हैं जो इसका लाभ उठा रहे हैं:

जब कोई भी सॉफ़्टवेयर गुणवत्ता की परवाह नहीं करता है तो आप अपने प्रोग्रामिंग कौशल में सुधार कर सकते हैं।

एक स्पष्ट क्षेत्र बड़ा डेटा मदद करेगा जो इलेक्ट्रॉनिक स्वास्थ्य रिकॉर्ड को सुरक्षित रूप से और सटीक रूप से चिकित्सा संगठनों में संभाल रहा है। सटीक रिकॉर्ड होने से मरीजों को बेहतर सेवा मिलेगी और त्रुटियों में कमी आएगी। स्वास्थ्य देखभाल क्षेत्र, स्पष्ट कारणों के लिए, रोगी गोपनीयता के बारे में सरकारी नियमों के अनुरूप करने के लिए धीमी गति से बड़े डेटा का उपयोग कर रहा है।

जैसा कि पहले उल्लेख किया गया है, बड़ा डेटा अनसुने सवालों के जवाब प्रदान करने के लिए जाना जाता है। स्वास्थ्य देखभाल क्षेत्र में, इसका मतलब हो सकता है कि एक नई दवा या उपचार ढूंढना जो अन्यथा नहीं मिला होगा। मैकिन्से एंड कंपनी के अनुसार, बड़ा डेटा दूरगामी भविष्य में निम्न संभव बना सकता है:

जैविक प्रक्रियाओं और दवाओं की भविष्यवाणी मॉडलिंग अधिक परिष्कृत और व्यापक हो जाती है।
मरीजों को सूचना के अधिक स्रोतों, जैसे कि सोशल मीडिया, के आधार पर नैदानिक परीक्षणों में भर्ती करने के लिए पहचाना जाता है।
तेजी से सुरक्षा या परिचालन संबंधी मुद्दों की पहचान करने के लिए वास्तविक समय में परीक्षणों की निगरानी की जाती है।
कठोर डेटा सिलोस के बजाय जो शोषण करना मुश्किल है, डेटा को इलेक्ट्रॉनिक रूप से कैप्चर किया जाता है और विभिन्न इकाइयों के बीच आसानी से प्रवाह होता है।

बड़ा डेटा, बड़ा अवसर

जबकि कुछ विशिष्ट क्षेत्रों में बड़े डेटा का लाभ उठाया जा रहा है, यह निम्नलिखित क्षेत्रों में सभी संगठनों के लिए अवसर प्रदान करता है:

बस किसी भी कंप्यूटिंग और नेटवर्किंग डिवाइस के डेटा को लॉग करता है। डेटा की मात्रा जल्दी से लॉग इन किया जा रहा है बेकार है। बिग डेटा आसानी से डेटा की उस मात्रा को प्रबंधित कर सकता है, जिससे प्रशासक नेटवर्क गतिविधि की निगरानी कर सकते हैं, समस्याओं का निदान कर सकते हैं या, उदाहरण के लिए, रुबिन ने मुझे दिया, कुछ नेटवर्क ट्रैफ़िक पैटर्न की तलाश करें जो मैलवेयर गतिविधि का संकेत देंगे।

यदि आप इस लेख को पढ़ रहे हैं, तो यह एक बहुत ही सुरक्षित शर्त है कि आप ओपनएसएसएल के आसपास के हार्टबल मुद्दे से अवगत हैं। तकनीकी समस्या के अलावा, चिंता है कि भेद्यता कई वर्षों से मौजूद है। रुबिन ने उल्लेख किया कि बड़ा डेटा नेटवर्क प्रशासकों को डेटा विश्लेषकों के साथ काम करने की अनुमति देता है, एक ऐसा प्रोग्राम बनाने के लिए जो दुर्भावनापूर्ण दिल की धड़कन के लिए सभी नेटवर्क लॉग की खोज करेगा। इस EFF पोस्ट का उल्लेख है:

"कोई भी नेटवर्क ऑपरेटर जिनके पास व्यापक पैकेट लॉग हैं, वे दुर्भावनापूर्ण दिल की धड़कनों की जांच कर सकते हैं, जिनमें सबसे अधिक 18 03 02 00 03 03 01 या 18 03 01 00 03 01 (या शायद 18 03 03 00 03 01) का टीसीपी पेलोड है।"

निम्न उदाहरण शो ऑडिट कमांड से नमूना आउटपुट है:

राउटर # शो ऑडिट

* 14 सितंबर 18: 37: 31.535:% AUDIT-1-RUN_VERSION: हैश:

24D98B13B87D106E7E6A7E5D1B3CE0AD उपयोगकर्ता:

* 14 सितंबर 18: 37: 31.583:% AUDIT-1-RUN_CONFIG: हैश:

4AC2D776AA6FCA8FD7653CEB8969B695 उपयोगकर्ता:

* 14 सितंबर 18: 37: 31.595:% AUDIT-1-STARTUP_CONFIG: हैश:

95DD497B1BB61AB33A629124CBFEC0FC उपयोगकर्ता:

* 14 सितंबर 18: 37: 32.107:% AUDIT-1-FILESYSTEM: हैश:

330E7111F2B526F0B850C24ED5774EDE उपयोगकर्ता:

* 14 सितंबर 18: 37: 32.107:% AUDIT-1-HARDWARE_CONFIG: हैश:

32F66463DDA802CC9171AF6386663D20 उपयोगकर्ता:

यदि आप समय टिकटों का पालन करते हैं, तो उन सभी प्रविष्टियों के लिए समय अंतराल एक सेकंड से कम था। मैं एक दिन के लिए भी एक्सट्रपलेशन नहीं करना चाहूंगा, दो साल अकेले!

कुछ देखना है

यदि आप नौकरी विज्ञापनों की जांच करते हैं, तो बड़े डेटा विशेषज्ञों की सख्त जरूरत है। मैंने रुबिन से इस बारे में पूछा। वह सहमत थे, अपने छात्रों का उल्लेख करते हुए उनकी संभावनाओं के बारे में उत्साहित थे। मैंने तब महसूस किया कि बड़े डेटा प्लेटफ़ॉर्म, विशेष रूप से जिन्हें ओपन सोर्स माना जाता है, वे एक टाइमलाइन का अनुसरण कर रहे हैं कि लिनक्स मुख्यधारा कैसे बने।

विश्वविद्यालय बड़े-डेटा प्लेटफ़ॉर्म के ओपन-सोर्स संस्करणों को गले लगाते हैं, विशेष रूप से Hadoop में, क्योंकि वे स्वतंत्र हैं, और छात्र स्रोत कोड में हेरफेर कर सकते हैं। तो जो स्नातक उन सभी नौकरी के उद्घाटन को भरते हैं, वे ओपन-सोर्स प्लेटफार्मों के साथ काम करना पसंद करते हैं, क्योंकि यह वही है जो वे सबसे अच्छा जानते हैं। यह देखना दिलचस्प होगा।