डाटा वेयरहाउसिंग 101

लेखक: Robert Simon
निर्माण की तारीख: 24 जून 2021
डेट अपडेट करें: 1 जुलाई 2024
Anonim
डाटा वेयरहाउस क्या है?
वीडियो: डाटा वेयरहाउस क्या है?

विषय



ले जाओ:

डेटा वेयरहाउसिंग ऐतिहासिक, वर्तमान और भविष्य के डेटा को मजबूत करने के लिए एक ठोस आधार प्रदान करता है, जिससे एक संगठन को रिपोर्ट बनाने, उन्नत विश्लेषण करने और कुछ डेटा खनन करने की अनुमति मिलती है।

कई व्यवसाय लगातार बड़ी मात्रा में डेटा एकत्र करते हैं। लेकिन उस जानकारी का उपयोग करने के लिए, इसे समझने के लिए प्रक्रियाओं और प्रक्रियाओं का एक कार्यात्मक सेट रखा जाना चाहिए।

चाहे आप डेटा वेयरहाउस डेवलपर हैं या आप पहली बार डेटा वेयरहाउसिंग शब्द की सुनवाई कर रहे हैं, डेटा वेयरहाउसिंग की मूल बातें समझें - इसका क्या मतलब है, इसका उपयोग कैसे किया जाता है और इसके क्या लाभ हो सकते हैं - आवश्यक है।

एक बार डेटा का ठीक से विश्लेषण करने के बाद, इसका उपयोग सकारात्मक और नकारात्मक प्रभावों की एक स्पष्ट तस्वीर बनाने के लिए किया जा सकता है जो एक उद्यम पर सामान्य रुझान और पैटर्न हैं। यह काफी सरल लगता है, लेकिन यह सुनिश्चित करना कि डेटा उपयोगी है, डेटा वेयरहाउसिंग में प्रमुख चुनौतियों में से एक है।

डेटा वेयरहाउसिंग क्या है?

एक डेटा वेयरहाउस एक केंद्रीकृत भंडारण इकाई (डेटाबेस) है जो डेटा को और उसके सभी इन-डेप्थ विवरण को परिभाषित और संयोजित करता है। इन विवरणों में एक एकीकृत डेटा मॉडल के उपयोग के माध्यम से एक संगठन ग्राहक आधार, सेवा प्रदाताओं, आपूर्तिकर्ताओं, लेनदेन या व्यावसायिक प्रक्रियाओं से संबंधित जानकारी शामिल हो सकती है। (बिजनेस प्रोसेस मैनेजमेंट के बारे में जानने के लिए BPM और SOA: हाउ वे ड्राइव बिजनेस देखें।)


डेटा वेयरहाउसिंग विभिन्न स्रोतों से डेटा खींचता है जो एक उद्यम में उपलब्ध कराया जाता है; फिर इस डेटा का विभिन्न तरीकों से विश्लेषण किया जा सकता है। एक डेटा वेयरहाउस एक एकीकृत, गैर-अस्थिर, समय-संस्करण और सूचना का विषय-उन्मुख संग्रह है। इसका मतलब यह है कि एक डेटा वेयरहाउस को निम्नलिखित लक्ष्य प्राप्त करने चाहिए:

  • व्यवसाय मेटाडेटा पर कब्जा और पहुंच प्रदान करें
  • डेटा की गुणवत्ता में सुधार और उत्पन्न रिपोर्ट विसंगतियों को कम करें
  • कई अलग-अलग स्रोतों से डेटा को एकीकृत करें और डेटा साझा करने के लिए प्रदान करें
  • प्रभावी और कुशलतापूर्वक ऐतिहासिक और वर्तमान डेटा को मर्ज करके सभी रिपोर्टिंग जरूरतों की गति और प्रदर्शन बढ़ाएं

डेटा के प्रकार

एक डेटा वेयरहाउस विभिन्न स्रोतों से डेटा लेकर और व्यावसायिक उपयोगकर्ताओं को एक साझा स्थान से महत्वपूर्ण डेटा को जल्दी से एक्सेस करने की अनुमति देकर बढ़ी हुई व्यापारिक खुफिया तकनीक प्रदान करता है। किसी डेटा वेयरहाउस में एकत्र किए गए डेटा का प्रकार विशिष्ट समय अवधि के भीतर विषय-उन्मुख, एकीकृत और पहचाना या सिंक्रनाइज़ किया जाता है।


जब डेटा वेयरहाउसिंग की बात आती है, तो चार प्रमुख प्रकार के डेटा होते हैं:

जब कोई भी सॉफ़्टवेयर गुणवत्ता की परवाह नहीं करता है तो आप अपने प्रोग्रामिंग कौशल में सुधार कर सकते हैं।

समय-वारंट डेटा

टाइम-वेरिएंट डेटा सुनिश्चित करता है कि डेटा वेयरहाउस में संग्रहीत सभी जानकारी वर्तमान और वास्तविक समय में उत्पन्न होती है। डेटा वेयरहाउस में सभी प्रमुख संरचनाओं में क्षितिज के दृष्टिकोण से जानकारी प्रदान करने का एक तत्व होता है, जैसे कि पिछले पांच से 10 साल।

विषय-उन्मुख डेटा

विषय-उन्मुख डेटा व्यवसाय की प्रमुख विषय श्रेणियों, जैसे ग्राहकों, बिक्री, उत्पादों और सेवाओं के आधार पर आयोजित किया जाता है। विषय अभिविन्यास संगठन के प्रमुख निर्णय निर्माताओं द्वारा उपयोग किए जाने वाले डेटा के मॉडल और विश्लेषण पर ध्यान केंद्रित करके निर्दिष्ट विषय मुद्दों का एक सरल और संक्षिप्त मूल्यांकन प्रदान करता है।

एकीकृत डेटा

एकीकृत डेटा एकाधिक, मिश्रित स्रोतों से बना होता है, जैसे कि रिलेशनल डेटाबेस, ऑनलाइन लेनदेन रिकॉर्ड और फ्लैट फाइलें। एक बार निर्दिष्ट स्रोतों को सफलतापूर्वक एकीकृत करने के बाद, डेटा सफाई लागू की जाती है। यह डेटा रूपांतरण के माध्यम से विशेषता उपायों, नामकरण परंपराओं, एन्कोडिंग संरचनाओं और प्रमुख शब्दों में स्थिरता सुनिश्चित करता है।

बिजनेस एनालिटिक्स और रिपोर्ट जनरेशन

एक डेटा वेयरहाउस बहुआयामी डेटा मॉडलिंग पर आधारित है। एक बहुआयामी डेटा मॉडल एक डेटा क्यूब के रूप में विभिन्न विचारों का निर्माण करता है, जो डेटा को मॉडरेट करने और कई आयामों के माध्यम से देखने की अनुमति देता है। डेटा वेयरहाउस एक संगठन द्वारा विस्तारित और विकसित होने पर उपयोग किए जाने वाले पहले चरणों में से एक है। यह मुख्य रूप से उपयोग किया जाता है जब कोई कंपनी व्यापार विश्लेषण में निवेश शुरू करने का फैसला करती है। व्यावसायिक विश्लेषण विभिन्न तकनीकी अनुप्रयोगों और प्रक्रियाओं का उपयोग करता है जो सांख्यिकीय डेटा के आधार पर व्यावसायिक आवश्यकताओं का पता लगाने और सुधारने के लिए निगम द्वारा उपयोग किया जाता है।

व्यावसायिक विश्लेषण संगठनों को ऐसे पैटर्नों की खोज और पहचान करने में मदद करते हैं जिनका उपयोग व्यावसायिक परिणामों की भविष्यवाणी, आकार और सुधार करने के लिए किया जा सकता है। हालांकि, इसके परिणाम इस प्रक्रिया के माध्यम से एकत्र हुए जो वास्तव में गिनती करते हैं, क्योंकि इनका उपयोग नई रणनीतियों के निर्माण, कार्यान्वयन और प्रबंधन का प्रस्ताव करने के लिए किया जाता है। (बैकग्राउंड रीडिंग के लिए, बिजनेस इंटेलीजेंस का परिचय देखें।)

व्यावसायिक विश्लेषणात्मक समाधान पिछले प्रदर्शन का मूल्यांकन करने और भविष्य की व्यवसाय योजना और विकल्पों के लिए तैयार करने के लिए मात्रात्मक और सांख्यिकीय तथ्य-आधारित डेटा लेते हैं। व्यवसाय डेटा संग्रह आमतौर पर सांख्यिकीय सॉफ़्टवेयर के उपयोग के माध्यम से मशीनों या अनुप्रयोगों द्वारा उत्पन्न होता है। यही कारण है कि कई कंपनियां एनालिटिक्स के आधार पर सुधार करने के लिए सांख्यिकीय सॉफ़्टवेयर का उपयोग करती हैं।

सांख्यिकीय सॉफ्टवेयर और बिजनेस इंटेलिजेंस

सांख्यिकीय सॉफ़्टवेयर को व्यावसायिक बुद्धिमत्ता (BI) सॉफ़्टवेयर के रूप में भी संदर्भित किया जाता है। कई कंपनियों के लिए, कोई विशिष्ट सॉफ़्टवेयर चयन प्रक्रिया नहीं है, जबकि अन्य एक कॉर्पोरेट मानक का पालन करते हैं या पहले से ही एक डेटाबेस या रिपोर्टिंग उपकरण है जो बस सक्रिय होने की आवश्यकता है। उपयुक्त विश्लेषणात्मक सॉफ़्टवेयर का चयन करते समय उपयोग की जाने वाली प्रक्रिया एक बीआई रणनीति बनाने और पहले से निर्धारित समग्र व्यावसायिक आवश्यकताओं के अनुपालन के साथ शुरू होती है।

व्यवसाय प्रबंधक और विश्लेषक उपयुक्त सॉफ़्टवेयर का चयन करने और यह सुनिश्चित करने में बड़ी भूमिका निभाते हैं कि उनकी व्यावसायिक विश्लेषण तकनीकें उन्हें सही दिशा में शुरू करेंगी। अमेज़ॅन जैसे व्यवसायों को मूल्य सीमाओं का पता लगाने के लिए ग्राहकों के बीच खरीद व्यवहार में रुझान को ट्रैक करने के लिए जाना जाता है जो लक्ष्य बाजार के साथ सबसे अधिक आरामदायक है। व्यवसाय तब अपने समग्र लाभ मार्जिन पर बहुत अधिक प्रभाव डाले बिना प्रतिस्पर्धी मूल्य दरों को प्रभावी ढंग से तय करने में सक्षम हैं। पूर्वनिर्धारित बीआई रणनीति के बिना, यह सामान्य है कि खरीदे गए सॉफ़्टवेयर का प्रकार किसी संगठन को उपयुक्त अनुकूलन क्षमताओं के साथ प्रदान नहीं करेगा जो उसे चाहिए।

डेटा माइनिंग

डेटा माइनिंग में साक्ष्य और तथ्य-आधारित निर्णय लेने के लिए उपयोगी अंतर्दृष्टि उत्पन्न करने के लिए डेटा में गहरी खुदाई शामिल है। तकनीकी शब्दों में, डेटा खनन का उपयोग बड़े संबंधपरक डेटाबेस के भीतर से विभिन्न क्षेत्रों में सहसंबंध या पैटर्न खोजने के लिए किया जा सकता है। अधिक विशेष रूप से, यह कई दृष्टिकोणों से जानकारी का विश्लेषण करने और इसे उपयोगी डेटा में सारांशित करने की प्रक्रिया है। एक सर्वोत्तम स्थिति में ये अंतर्दृष्टि व्यवसाय में कटौती की लागत, बिक्री बढ़ाने और अन्य प्रमुख प्रदर्शन संकेतकों को प्रभावित करने में मदद कर सकती हैं।

डेटा माइनिंग एक शक्तिशाली तकनीक है जिसका उपयोग विभिन्न डेटा स्रोतों और रिकॉर्डों के बीच मौजूद कई विभिन्न आयामों, श्रेणियों और संबंधों को खोजने के लिए किया जा सकता है। उदाहरण के लिए, खुदरा क्षेत्र में, डेटा माइनिंग से कंपनी को बिक्री पैटर्न और ग्राहक व्यवहार को पहचानने में मदद मिल सकती है, जिससे उन्हें अपने लाभ के लिए जानकारी का दोहन करने की अनुमति मिलती है। इसका एक कुख्यात उदाहरण रिटेलर टारगेट्स है जो यह निर्धारित करने की क्षमता रखता है कि दुकानदारों में से कौन सी उम्मीद कर सकता है, स्टोर को बच्चे की वस्तुओं के लिए कूपन देने में सक्षम बनाता है जब माता-पिता उनके लिए खरीदारी शुरू करते हैं।

संक्षेप में डेटा वेयरहाउसिंग

जब डेटा वेयरहाउसिंग तकनीकों को एकीकृत और लागू किया जाता है, तो बिजनेस एनालिटिक्स के तरीके संगठनों को अपने समग्र व्यापार रणनीतियों को बढ़ाने और बीआई सॉफ्टवेयर के उपयोग के माध्यम से अनुकूलित निर्णय लेने की अनुमति देते हैं। एनालिटिक्स किसी भी संगठन में एक महत्वपूर्ण भूमिका निभाता है, और कई अलग-अलग प्रक्रियाएं, जिसमें डेटा खनन और अन्य विभिन्न विश्लेषणात्मक तरीके शामिल हैं, का उपयोग उचित डेटा संग्रह सेवाओं और विपणन का समर्थन करने और उत्पन्न करने के लिए किया जा सकता है। ग्राहक सेवा में सुधार, इन्वेंट्री प्रबंधन को आसान बनाने, व्यक्तिगत ग्राहकों की जरूरतों को पूरा करने वाले उत्पादों को क्रॉस-प्रमोशन और महत्वपूर्ण उत्पाद और सेवा विश्लेषण प्रदान करके नए अवसरों और संभावनाओं का पता लगाया जाता है।

डेटा वेयरहाउसिंग वह है जो संगठनों को डेटा के बड़े सेट में जटिल सवालों के जवाब खोजने की अनुमति देता है। डिजिटल डेटा संग्रह और भंडारण की शक्ति।