डेटा सफाई

लेखक: Randy Alexander
निर्माण की तारीख: 26 अप्रैल 2021
डेट अपडेट करें: 1 जुलाई 2024
Anonim
Automating Data Cleaning and Data Analysis with Mito
वीडियो: Automating Data Cleaning and Data Analysis with Mito

विषय

परिभाषा - डेटा क्लींजिंग का क्या अर्थ है?

डेटा क्लींजिंग किसी दिए गए संग्रहण संसाधन में डेटा को बदलने की प्रक्रिया है ताकि यह सुनिश्चित किया जा सके कि यह सही और सही है। विभिन्न सॉफ्टवेयर और डेटा स्टोरेज आर्किटेक्चर में डेटा क्लींजिंग को आगे बढ़ाने के कई तरीके हैं; उनमें से अधिकांश डेटा सेटों की सावधानीपूर्वक समीक्षा और किसी विशेष डेटा भंडारण तकनीक से जुड़े प्रोटोकॉल पर केंद्रित हैं।


डेटा क्लींजिंग को डेटा क्लीनिंग या डेटा स्क्रबिंग के रूप में भी जाना जाता है।

Microsoft Azure और Microsoft क्लाउड का परिचय | इस गाइड के दौरान, आप जानेंगे कि क्लाउड कंप्यूटिंग क्या है और Microsoft Azure आपको क्लाउड से अपना व्यवसाय चलाने और चलाने में कैसे मदद कर सकता है।

Techopedia डेटा क्लींजिंग की व्याख्या करता है

डेटा क्लीयरिंग की तुलना कभी-कभी डेटा पर्जिंग से की जाती है, जहां डेटा सेट से पुराना या बेकार डेटा हटा दिया जाएगा। हालांकि डेटा क्लींजिंग में पुराने, अधूरे या डुप्लिकेट किए गए डेटा को हटाना शामिल हो सकता है, डेटा क्लींजिंग उस डेटा को शुद्ध करने से अलग होती है, जो आमतौर पर नए डेटा के लिए स्पेस क्लीयर करने पर केंद्रित होती है, जबकि डेटा क्लींजिंग किसी सिस्टम में डेटा की सटीकता को अधिकतम करने पर केंद्रित होती है। एक डेटा क्लींजिंग विधि वाक्यविन्यास त्रुटियों, टाइपोग्राफिक त्रुटियों या रिकॉर्ड के टुकड़े से छुटकारा पाने के लिए पार्सिंग या अन्य तरीकों का उपयोग कर सकती है। डेटा सेट का सावधानीपूर्वक विश्लेषण यह दिखा सकता है कि दोहराव के कारण कई सेटों को कैसे मर्ज किया गया है, इस मामले में समस्या को ठीक करने के लिए डेटा क्लींजिंग का उपयोग किया जा सकता है।


डेटा क्लींजिंग से जुड़े कई मुद्दे समस्याओं के समान होते हैं, जो अभिलेखीय, डेटाबेस व्यवस्थापक कर्मचारी और अन्य लोग डेटा रखरखाव, लक्षित डेटा खनन और अर्क, ट्रांसफ़ॉर्म, लोड (ETL) कार्यप्रणाली जैसी प्रक्रियाओं का सामना करते हैं, जहां पुराने डेटा को नए डेटा सेट में पुनः लोड किया जाता है। ये मुद्दे अक्सर SQL या Oracle जैसी डेटाबेस और सर्वर प्रौद्योगिकियों में संबंधित कार्यों को प्रभावित करने के लिए वाक्यविन्यास और कमांड के विशिष्ट उपयोग का संबंध है। डेटाबेस प्रशासन कई व्यवसायों और संगठनों में एक महत्वपूर्ण भूमिका है जो बड़े डेटा सेट और वाणिज्य या किसी अन्य पहल के सटीक रिकॉर्ड पर निर्भर करते हैं।