डेटा साइंस या मशीन लर्निंग? Heres कैसे अंतर हाजिर करने के लिए

लेखक: Laura McKinney
निर्माण की तारीख: 3 अप्रैल 2021
डेट अपडेट करें: 1 जुलाई 2024
Anonim
डेटा वैज्ञानिक बनने के लिए इन 9 कौशलों को हासिल करें - (2019)
वीडियो: डेटा वैज्ञानिक बनने के लिए इन 9 कौशलों को हासिल करें - (2019)

विषय


स्रोत: एलेनूर / ड्रीमस्टाइम डॉट कॉम

ले जाओ:

डेटा साइंस और मशीन लर्निंग प्रमुख तरीकों से अलग हैं। कुछ मायनों में, एक को दूसरे के सबसेट के रूप में देखा जा सकता है। वर्तमान आईटी प्रगति में दोनों महत्वपूर्ण हैं।

कृत्रिम बुद्धिमत्ता और डेटा प्रबंधन की इस नई दुनिया में, कुछ ऐसे शब्दों से भ्रमित होना आसान है जो आईटी दुनिया में सबसे अधिक उपयोग किए जाते हैं।

उदाहरण के लिए, डेटा साइंस और मशीन लर्निंग का एक दूसरे के साथ बहुत कुछ है। यह आश्चर्य की बात नहीं है कि इन विषयों के केवल एक पासिंग ज्ञान वाले कई लोगों को यह पता लगाने में परेशानी होगी कि वे एक दूसरे से अलग कैसे हैं।

यहाँ मशीन विज्ञान से एक सिद्धांत और एक तकनीकी दृष्टिकोण के रूप में डेटा विज्ञान को अलग करने का सबसे अच्छा तरीका है।

डेटा साइंस एंड मशीन लर्निंग: ब्रॉड एंड नैरो शब्दावली

सबसे पहले, डेटा विज्ञान वास्तव में प्रौद्योगिकी का एक व्यापक, व्यापक श्रेणी है जो कई विभिन्न प्रकार की परियोजनाओं और कृतियों को शामिल करता है। (डेटा साइंस जॉब में शामिल व्हाट्सएप पर अधिक जानकारी के लिए, जॉब रोल: डेटा साइंटिस्ट देखें।)


डेटा विज्ञान अनिवार्य रूप से बड़े डेटा के साथ काम करने का अभ्यास है। यह मूर के कानून के रूप में उभरा और अधिक कुशल भंडारण उपकरणों के प्रसार ने कंपनियों और अन्य दलों द्वारा भारी मात्रा में डेटा एकत्र किया। फिर, डेटा प्रबंधन जैसे बड़े डेटा प्लेटफ़ॉर्म और टूल ने डेटा प्रबंधन कैसे काम करता है, इसे बदलकर कंप्यूटिंग को फिर से परिभाषित करना शुरू कर दिया। अब, क्लाउड और कंटेनरीकरण के साथ-साथ बिल्कुल नए मॉडल, बड़ा डेटा उन तरीकों का एक प्रमुख चालक बन गया है जो हम काम करते हैं और जीते हैं।

इसके सरलतम रूप में, डेटा विज्ञान वह तरीका है जो हम उस डेटा को प्रबंधित करते हैं, इसे साफ करने से लेकर इसे अंतर्दृष्टि के रूप में उपयोग करने के लिए परिष्कृत करते हैं।

मशीन लर्निंग की परिभाषा बहुत संकीर्ण है। मशीन लर्निंग में, प्रौद्योगिकियां डेटा लेती हैं और इसे एल्गोरिदम के माध्यम से डालती हैं, ताकि मानव संज्ञानात्मक प्रक्रियाओं को "सीखने" के रूप में वर्णित किया जा सके। दूसरे शब्दों में, डेटा में लिया गया और उस पर प्रशिक्षित किया गया, कंप्यूटर अपने स्वयं के परिणाम प्रदान करने में सक्षम है। , जहां प्रौद्योगिकी प्रोग्रामरों द्वारा लगाई गई प्रक्रियाओं से सीखी गई है।


डाटा साइंस और मशीन लर्निंग स्किल सेट

डेटा विज्ञान और मशीन लर्निंग के विपरीत एक और तरीका उन विभिन्न कौशलों को देखना है जो इन दोनों क्षेत्रों में पेशेवरों के लिए सबसे अधिक मूल्यवान हैं।

नो बग्स, नो स्ट्रेस - योर स्टेप बाय स्टेप गाइड बाय स्टेप गाइड टू लाइफ-चेंजिंग सॉफ्टवेर विदाउट योर लाइफ

जब कोई भी सॉफ़्टवेयर गुणवत्ता की परवाह नहीं करता है तो आप अपने प्रोग्रामिंग कौशल में सुधार कर सकते हैं।

एक आम सहमति है कि डेटा वैज्ञानिकों को गहरी विश्लेषणात्मक और गणित कौशल से लाभ होता है, डेटाबेस प्रौद्योगिकियों के साथ हाथों का अनुभव, और पायथन या अन्य पैकेज जैसी प्रोग्रामिंग भाषाओं का ज्ञान जो बड़े डेटा को पार्स करने के लिए उपयोग किया जाता है।

सिंपिलनियर में श्रीहरिकुमार लिखते हैं, "(डेटा साइंस) में एक मजबूत कैरियर बनाने के इच्छुक किसी भी व्यक्ति को तीन विभागों में महत्वपूर्ण कौशल हासिल करना चाहिए: एनालिटिक्स, प्रोग्रामिंग और डोमेन ज्ञान।" “एक स्तर पर गहराई से जाने पर, निम्न कौशल आपको एक डेटा वैज्ञानिक के रूप में एक आला को उकेरने में मदद करेंगे: पायथन, एसएएस, आर (और) स्काला का मजबूत ज्ञान, SQL डेटाबेस कोडिंग में अनुभव, हाथों से अनुभवहीन डेटा के साथ काम करने की क्षमता वीडियो और सोशल मीडिया जैसे विभिन्न स्रोत, मशीन सीखने के कई विश्लेषणात्मक कार्यों (और) के ज्ञान को समझते हैं। "

मशीन सीखने के पक्ष में, विशेषज्ञ अक्सर डेटा मॉडलिंग कौशल, संभाव्यता और सांख्यिकी ज्ञान और मशीन प्रोग्रामिंग इंजीनियर के टूलकिट में सहायक उपकरण के रूप में व्यापक प्रोग्रामिंग कौशल का हवाला देते हैं।

मशीन लर्निंग स्पॉट कैसे करें

यहां कुंजी यह है कि सभी प्रकार की चीजों में डेटा विज्ञान कार्य शामिल हैं, लेकिन यह तब तक सीखने की मशीन नहीं है जब तक कि आपके इनपुट से कंप्यूटर को सीखने में मदद करने के लिए आपके पास एक बहुत ही सख्त व्यवस्था न हो।

जब यह लागू होता है, तो यह कुछ आश्चर्यजनक रूप से सक्षम प्रणालियों के लिए बनाता है जो हमारे जीवन पर व्यापक प्रभाव डाल सकते हैं।

अमेजन के संस्थापक जेफ बेजोस ने कथित तौर पर इस प्रकार के सिस्टम के कुछ अनुप्रयोगों की ओर इशारा करते हुए कहा, "मशीन लर्निंग के साथ हम जो कुछ भी करते हैं वह सतह के नीचे होता है।" “मशीन लर्निंग हमारे एल्गोरिदम को मांग पूर्वानुमान, उत्पाद खोज रैंकिंग, उत्पाद और सौदों की सिफारिशें, बिक्री प्लेसमेंट, धोखाधड़ी का पता लगाने, अनुवाद, और बहुत कुछ के लिए प्रेरित करता है। यद्यपि कम दिखाई देता है, मशीन सीखने का बहुत प्रभाव इस प्रकार का होगा - चुपचाप लेकिन सार्थक रूप से कोर संचालन में सुधार। ”

यहां सबसे उपयोगी उदाहरणों में से एक तंत्रिका नेटवर्क का उद्भव है - यह मशीन सीखने की प्रक्रिया स्थापित करने का एक आम और लोकप्रिय तरीका है।

अपने सबसे बुनियादी रूप में, तंत्रिका नेटवर्क कृत्रिम न्यूरॉन्स की परतों से बना है। प्रत्येक व्यक्तिगत कृत्रिम न्यूरॉन में एक जैविक न्यूरॉन के बराबर कार्यक्षमता होती है - लेकिन सिनाप्सेस और डेंड्राइट्स के बजाय, इसमें इनपुट, एक सक्रियण फ़ंक्शन और अंतिम आउटपुट होते हैं।

तंत्रिका नेटवर्क को मानव मस्तिष्क की तरह कार्य करने के लिए बनाया गया है, और मशीन लर्निंग पेशेवर अक्सर मशीन लर्निंग परिणाम बनाने के लिए इस मॉडल का उपयोग करते हैं।

हालाँकि, यह मशीन सीखने का एकमात्र तरीका नहीं है। कुछ और अल्पविकसित मशीन सीखने की परियोजनाओं में केवल कंप्यूटर को तस्वीरों की एक विस्तृत श्रृंखला दिखाना (या अन्य कच्चे डेटा के साथ इसकी आपूर्ति करना) शामिल है, पर्यवेक्षित मशीन सीखने और लेबल डेटा का उपयोग करने की प्रक्रिया के माध्यम से विचारों को इनपुट करना, और कंप्यूटर का अंततः भेदभाव करना। एक दृश्य क्षेत्र में विभिन्न आकार या आइटम। (मशीन लर्निंग पर मूल बातें के लिए, मशीन लर्निंग 101 देखें।)

दो अत्याधुनिक एज अनुशासन

अंत में, मशीन लर्निंग डेटा विज्ञान का एक महत्वपूर्ण हिस्सा है। लेकिन डेटा साइंस, वेस्टर फ्रंटियर और कोन का प्रतिनिधित्व करता है जिसमें मशीन लर्निंग होता है।

एक तरह से, आप कह सकते हैं कि मशीन लर्निंग कभी भी बड़े डेटा के बिना नहीं होगा। बड़े डेटा ने स्वयं मशीन लर्निंग का निर्माण नहीं किया, हालांकि - इसके बजाय, हमने सामूहिक रूप से इतना डेटा एकत्र किया था कि हम लगभग यह नहीं जानते थे कि इसके साथ क्या करना है, शीर्ष दिमाग इन जैव-अनुकरण प्रक्रियाओं के साथ एक सुपरचार्ज्ड तरीके से आया था अंतर्दृष्टि प्रदान करना।

यहां ध्यान रखने वाली एक और अच्छी बात यह है कि डेटा विज्ञान को दो प्रमुख तरीकों से लागू किया जा सकता है - हम मशीन लर्निंग और आर्टिफिशियल इंटेलिजेंस को गले लगा सकते हैं, जिससे कंप्यूटर हमारे लिए सोच सकते हैं, या हम डेटा साइंस को फिर से मानव-केंद्रित दृष्टिकोण में ला सकते हैं। कंप्यूटर केवल परिणाम प्रस्तुत करता है और हम मनुष्य निर्णय लेते हैं।

आज के शीर्ष नवप्रवर्तकों में से कुछ के साथ कुछ विशेषज्ञ, जो इन तकनीकों का उपयोग करते हैं, के अधिक जीवंत लेखांकन के लिए कहते हैं।

एलोन मस्क ने कहा है, "एआई (एआई) लगभग किसी को भी नहीं जानता है और सुधार की दर बहुत अधिक है।"

किसी भी मामले में, डेटा विज्ञान और मशीन लर्निंग दोनों प्रगति के मुख्य भाग हैं जो आज हम समाज में प्रौद्योगिकी के रूप में बना रहे हैं।