डाटा साइंस सीखने के लिए 12 मुख्य टिप्स

लेखक: Laura McKinney
निर्माण की तारीख: 3 अप्रैल 2021
डेट अपडेट करें: 1 जुलाई 2024
Anonim
डेटा विश्लेषक और डेटा विज्ञान के लिए पायथन सीखने की 12 दिन की योजना
वीडियो: डेटा विश्लेषक और डेटा विज्ञान के लिए पायथन सीखने की 12 दिन की योजना

विषय


स्रोत: Artinspiring / Dreamstime.com

ले जाओ:

डेटा वैज्ञानिकों को स्पष्ट रूप से मजबूत गणित और कोडिंग कौशल की आवश्यकता होती है, लेकिन सफलता के लिए संचार और अन्य नरम कौशल भी आवश्यक हैं।

ग्लास साइंटिस्ट पर अमेरिका में 2019 के लिए डेटा साइंटिस्ट की सबसे अच्छी नौकरी है। $ 108,000 के मध्य आधार वेतन और 5 में से 4.3 की नौकरी से संतुष्टि रैंक के साथ, अधिक संख्या में उद्घाटन की भविष्यवाणी की, यह आश्चर्य की बात नहीं है। सवाल यह है कि इस नौकरी के लिए अर्हता प्राप्त करने के लिए किसी को क्या करना होगा?

यह जानने के लिए, हमने उन लोगों को दी गई सलाह को देखा जो इस कैरियर ट्रैक पर जाना चाहते हैं। बहुत कोडिंग और गणित में कठिन कौशल के लिए नीचे आता है। लेकिन यह मजबूत गणना अकेले नहीं काटती है। सफल डेटा वैज्ञानिकों को भी अपनी शर्तों पर व्यवसाय के लोगों से बात करने में सक्षम होने की आवश्यकता होती है, जो नरम कौशल और नेतृत्व से जुड़ी क्षमताओं के लिए कहते हैं। (डेटा साइंटिस्ट के कर्तव्यों के बारे में अधिक जानने के लिए, जॉब रोल: डेटा साइंटिस्ट देखें।)

एजुकेशनल फाउंडेशन का निर्माण: तीन प्राथमिक सुझाव

एनवाईसी डेटा साइंस एकेडमी के डेटा वैज्ञानिक ड्रेस ज़ान ने एक शैक्षिक नींव की आवश्यकता पर जोर दिया है जिसमें कोडिंग और गणित की क्षमता शामिल है:


  1. आर / पायथन + एसक्यूएल। यदि आपके पास कोडिंग कौशल नहीं है, तो आपको इस घाटे को पूरा करने के लिए बहुत सारी नेटवर्किंग शक्ति और अन्य क्षेत्रों की आवश्यकता होगी। मैंने कमजोर गणित और कम डोमेन अनुभव वाले डेटा वैज्ञानिकों को देखा है, लेकिन उन्हें हमेशा कोड करने की एक मजबूत क्षमता द्वारा ले जाया गया है। पायथन आदर्श है लेकिन आर एक महान गिरावट बैक टूल है। आपके शस्त्रागार में दोनों का होना सबसे अच्छा है डेटा एनालिस्ट के लिए SQL भी बेहद जरूरी है।

  2. मजबूत गणित कौशल। आमतौर पर इस्तेमाल किए जाने वाले कुछ तरीकों की बहुत अच्छी समझ होना: सामान्यीकृत रेखीय मॉडल, निर्णय वृक्ष, के-साधन, और सांख्यिकीय परीक्षण विभिन्न मॉडलों या RNN जैसे विशेषज्ञता की व्यापक तस्वीर होने से बेहतर है।

वे केंद्रीय कौशल हैं जिनके निर्माण के लिए, हालांकि कुछ विशेषज्ञ उन्हें जोड़ते हैं। उदाहरण के लिए, एक केडानुगेट्स सूची में ज़ैन का उल्लेख करने वाले कोडिंग घटक शामिल हैं और तकनीकी पक्ष पर जानने के लिए कुछ अन्य उपयोगी चीजों को जोड़ता है, जिसमें Hadoop प्लेटफॉर्म Apache Spark, डेटा विज़ुअलाइज़ेशन, अनस्ट्रक्चर्ड डेटा, मशीन लर्निंग और AI शामिल हैं।


लेकिन अगर हम एक कगले सर्वेक्षण द्वारा वास्तविक जीवन में उपयोग के लिए पहचाने जाने वाले सबसे अधिक इस्तेमाल किए जाने वाले औजारों पर एक सर्वेक्षण से अपना संकेत लेते हैं, तो हमें कुछ परिणाम मिलते हैं। जैसा कि आप नीचे दिए गए शीर्ष 15 विकल्पों के ग्राफ से देख सकते हैं, पायथन, आर और एसक्यूएल आसानी से शीर्ष तीन बनाते हैं, लेकिन चौथा जुपिटर नोटबुक है, इसके बाद TensorFlow, Amazon Web Services, Unix shell, Tableau, C / C ++, NoSQL , MATLAB / ऑक्टेव और जावा, Hadoop और स्पार्क से आगे। एक और अतिरिक्त जो लोगों को आश्चर्यचकित कर सकता है, वह है माइक्रोसॉफ्ट का एक्सेल डेटा माइनिंग।

कागले की छवि शिष्टाचार

केडनगेट्स सूची में औपचारिक शिक्षा से संबंधित एक टिप भी शामिल है। अधिकांश डेटा वैज्ञानिकों के पास उन्नत डिग्री है: 46 प्रतिशत के पास पीएचडी है, और 88 प्रतिशत के पास कम से कम मास्टर स्तर की डिग्री है। उनके पास स्नातक की उपाधि आम तौर पर संबंधित क्षेत्रों के बीच विभाजित होती है। लगभग एक तिहाई गणित और सांख्यिकी में हैं, जो इस कैरियर ट्रैक के लिए सबसे लोकप्रिय है। अगली सबसे लोकप्रिय एक कंप्यूटर विज्ञान की डिग्री है, जो 19 प्रतिशत और इंजीनियरिंग, 16 प्रतिशत की पसंद है। बेशक, डेटा विज्ञान के लिए विशेष रूप से तकनीकी उपकरण अक्सर डिग्री कार्यक्रमों में नहीं बल्कि विशेष बूट शिविरों में या ऑनलाइन पाठ्यक्रमों के माध्यम से अध्ययन किए जाते हैं।

पाठ्यक्रम से अधिक: दो और सुझाव

वेन कॉर्नेल मेडिसिन में पल्मोनरी विभाग में एक अनुसंधान सहायक और एनवाईसी डेटा साइंस अकादमी में छात्र हैंक यूं, आकांक्षी डेटा वैज्ञानिकों को सलाह देते हैं कि वे जो काम करेंगे और उसके बारे में पता लगाएंगे। उसने कहा:

नो बग्स, नो स्ट्रेस - योर स्टेप बाय स्टेप गाइड बाय स्टेप गाइड टू लाइफ-चेंजिंग सॉफ्टवेर विदाउट योर लाइफ

जब कोई भी सॉफ़्टवेयर गुणवत्ता की परवाह नहीं करता है तो आप अपने प्रोग्रामिंग कौशल में सुधार नहीं कर सकते हैं।

मैंने खुद को यह बताकर गलती नहीं की कि आप डेटा साइंस जानते हैं क्योंकि आपने एक कोर्स किया और एक सर्टिफिकेट प्राप्त किया। यह एक शानदार शुरुआत है, लेकिन जब आप अध्ययन शुरू करते हैं, तो एक परियोजना को ध्यान में रखकर जाएं। फिर क्षेत्र में एक संरक्षक खोजें और तुरंत एक जुनून परियोजना शुरू करें! जब आप ताजा होते हैं, तो आप यह नहीं जानते कि आप क्या नहीं जानते हैं, इसलिए यह तब मदद करता है जब कोई व्यक्ति आपको मार्गदर्शन करने के लिए आपके लिए क्या महत्वपूर्ण है और क्या नहीं। आप इसके लिए कुछ भी नहीं दिखाने के साथ अध्ययन करने में बहुत समय बिताना चाहते हैं!

आपके टूलबॉक्स से कौन सा उपकरण लेना है यह जानना: वक्र से आगे रहने के लिए टिप

डेटा साइंस टूल्स की रैंकिंग में असमानता को देखते हुए, कुछ को इस बात पर घबराहट हो सकती है कि किस पर ध्यान केंद्रित करें। सेलेस्टे फ्रालिक, सुरक्षा सॉफ्टवेयर कंपनी मैकएफी के मुख्य डेटा वैज्ञानिक, एक सीआईओ लेख में इस मुद्दे को संबोधित करते हैं जो एक डेटा वैज्ञानिक के लिए आवश्यक कौशल को देखता है, घोषणा करता है, "एक डेटा वैज्ञानिक को अनुसंधान में वक्र के सामने रहने की जरूरत है, साथ ही साथ समझें कि कब और किस तकनीक को लागू करना है। "इसका मतलब है कि" 'सेक्सी' और नए, जब वास्तविक समस्या "द्वारा लुभाया नहीं जा रहा है" के लिए कुछ अधिक रन-ऑफ-द-मिल की आवश्यकता है। "पारिस्थितिक तंत्र, व्याख्यात्मकता, विलंबता, बैंडविड्थ, और अन्य सिस्टम सीमा शर्तों के साथ-साथ ग्राहक की परिपक्वता के लिए कम्प्यूटेशनल लागत के बारे में पता होने के नाते - डेटा वैज्ञानिक को यह समझने में मदद करता है कि कौन सी तकनीक को लागू करना है।"

आवश्यक शीतल कौशल: एक और छह युक्तियाँ

फ़्रालेक बिंदु गैर-तकनीकी कौशल से संबंधित है जिसे डेटा वैज्ञानिक नौकरी की आवश्यकता होती है। यही कारण है कि केडनगेट्स सूची में ये चार शामिल हैं: बौद्धिक जिज्ञासा, टीमवर्क, संचार कौशल और व्यावसायिक कौशल। Zhan ने डेटा वैज्ञानिकों के लिए अपने सुझावों में प्रमुख सॉफ्ट स्किल्स को भी शामिल किया, जो कि केडनगेट्स की तरह "कम्युनिकेशन स्किल्स" की पहचान करते हैं, लेकिन "बिजनेस एक्यूमेन" के स्थान पर "डोमेन विशेषज्ञता" का उपयोग करते हुए, इसे जो भी कहा जाता है, वह डेटा साइंस के व्यावहारिक अनुप्रयोग को संदर्भित करता है। व्यापार। (संचार कौशल के बारे में अधिक जानने के लिए, तकनीकी पेशेवरों के लिए संचार कौशल का महत्व देखें।)

ओलिविया पर्र-रड ने इस पर अपनी खुद की स्पिन की पेशकश की, दो और सॉफ्ट स्किल्स में, रचनात्मकता की भूमिका पर जोर देते हुए, जोर देकर कहा, "मैं डेटा साइंस को एक कला के रूप में एक विज्ञान के रूप में ज्यादा मानता हूं," कुछ ऐसा जो ड्राइंग पर चाहिए मस्तिष्क के दोनों किनारों की ताकत। “कई लोग डेटा विज्ञान के बारे में एक कैरियर के रूप में बात करते हैं जो मुख्य रूप से बाएं-मस्तिष्क का उपयोग करता है। मैंने पाया है कि सफल होने के लिए, डेटा वैज्ञानिकों को अपने पूरे मस्तिष्क का उपयोग करना चाहिए। ”

उन्होंने बताया कि क्षेत्र में आगे बढ़ने के लिए न केवल तकनीकी योग्यता, बल्कि रचनात्मकता और नेतृत्व के लिए आवश्यक दृष्टि की आवश्यकता होती है:

अधिकांश बाएं-मस्तिष्क / रैखिक कार्य स्वचालित या आउट-सोर्स किए जा सकते हैं। डेटा वैज्ञानिकों के रूप में एक प्रतिस्पर्धी बढ़त की पेशकश करने के लिए, हमें अपने मस्तिष्क के दोनों किनारों का उपयोग करके बड़ी मात्रा में सूचनाओं को पहचानने और उनका संश्लेषण करने में सक्षम होना चाहिए। और हमें नवीन विचारक होने चाहिए। सर्वश्रेष्ठ परिणामों में से कई परिणाम बाएं और दाएं मस्तिष्क के एकीकरण से होते हैं।

उन्होंने इस बात पर भी जोर दिया कि दृष्टि का संचार स्पष्ट रूप से क्यों आवश्यक है:

डेटा वैज्ञानिकों के रूप में, हमारा लक्ष्य डेटा का उपयोग करना है ताकि हमारे ग्राहकों को उनके मुनाफे को बढ़ाने में मदद मिल सके। अधिकांश अधिकारी यह नहीं समझते कि हम क्या करते हैं या कैसे करते हैं। इसलिए हमें नेताओं की तरह सोचने और भाषा में अपने निष्कर्षों और सिफारिशों को संप्रेषित करने की आवश्यकता है, जिसे हमारे हितधारक समझ और विश्वास करते हैं।

डेटा दर्जन

मुख्य युक्तियों में बड़ी संख्या में तकनीकी उपकरण, कौशल और क्षमताएं शामिल हैं, साथ ही रचनात्मकता और नेतृत्व के लिए योग्यता जैसे कम मात्रात्मक गुण भी शामिल हैं। अंततः, यह केवल एक संख्या का खेल नहीं है। जैसा कि डेटा विज्ञान एक वैक्यूम में मॉडल बनाने के बारे में नहीं है, लेकिन व्यवसायों के लिए वास्तविक जीवन की समस्याओं को हल करने के लिए व्यावहारिक अनुप्रयोगों के साथ आ रहा है, जो लोग उस क्षेत्र में सफल होंगे, उन्हें न केवल मास्टर तकनीक की जरूरत है, बल्कि उनके व्यापार डोमेन को जानने और उसकी जरूरतों को समझने की जरूरत है काम पर टीम के विभिन्न सदस्यों।