मशीन लर्निंग प्रोजेक्ट शुरू करने के बारे में 4 मिथक

लेखक: Laura McKinney
निर्माण की तारीख: 3 अप्रैल 2021
डेट अपडेट करें: 22 जून 2024
Anonim
Django project on Machine learning| House Price Prediction System | Part 4 | Designing the home page
वीडियो: Django project on Machine learning| House Price Prediction System | Part 4 | Designing the home page

विषय


स्रोत: मोनसिट्ज / आईस्टॉकफोटो

ले जाओ:

उद्यम अपनाने के लिए बेहतर तरीके से उन्मुख होने के लिए मशीन लर्निंग के इन मिथकों के बारे में जानें।

यह हल्के में लेने की बात नहीं है - मशीन लर्निंग प्रोजेक्ट के साथ शुरू करना उन अधिकारियों के लिए एक कठिन प्रक्रिया हो सकती है जो इस आईटी प्रवृत्ति का लाभ उठाना चाहते हैं, लेकिन इन-हाउस ज्ञान की कमी हो सकती है जो वास्तव में इनस और बाहरी को समझने के लिए मशीन बनाता है सीखने परियोजनाओं टिक।

यहाँ हम उन कुछ मूल भ्रांतियों के बारे में बात करेंगे जो इस बात पर प्रभाव डाल रही हैं कि कैसे कंपनियां तेज़ी से बदलते बाज़ार में मशीन सीखने की तकनीक विकसित करती हैं। (डेटा साइंस एक अन्य फील्ड व्यवसाय है, जो लागू हो रहा है, लेकिन यह ML से कैसे भिन्न है? डेटा साइंस या मशीन लर्निंग में पता करें? Heres How to Spot the Difference।)

मिथक # 1: अधिक डेटा हमेशा बेहतर होता है

यह वास्तव में मशीन सीखने के सबसे बड़े मिथकों में से एक है। लोगों को लगता है कि अधिक डेटा का मतलब एक्शन करने योग्य अंतर्दृष्टि पर सान करने की अधिक क्षमता है। कुछ मामलों में, वे सही हैं, लेकिन अधिक बार, रिवर्स सच हो सकता है।


अधिक डेटा केवल तभी बेहतर है जब यह प्रासंगिक डेटा है जो पूरी तस्वीर में जोड़ता है। डेटा को मशीन लर्निंग मॉडल को फिट करना पड़ता है, या प्रोग्राम को "ओवरफिटिंग" नामक किसी चीज़ से पीड़ित किया जा सकता है, जहाँ मशीन लर्निंग परिणाम उन तरीकों से प्रकट होने में विफल होते हैं जो उन्हें चाहिए।

मशीन लर्निंग मास्टरी में जेसन ब्राउनली लिखते हैं, "मशीन लर्निंग में खराब प्रदर्शन का कारण या तो डेटा ओवरफिटिंग या अंडरफ़िटिंग है।"

आंकड़ों में, एक फिट से तात्पर्य है कि आप लक्ष्य फ़ंक्शन को कितनी अच्छी तरह समझते हैं। मशीन लर्निंग में उपयोग करने के लिए यह अच्छी शब्दावली है, क्योंकि पर्यवेक्षित मशीन लर्निंग एल्गोरिदम इनपुट चर दिए गए आउटपुट चर के लिए अज्ञात अंतर्निहित मैपिंग फ़ंक्शन का अनुमान लगाना चाहते हैं। आंकड़े अक्सर फिट की अच्छाई का वर्णन करते हैं जो यह अनुमान लगाने के लिए उपयोग किए गए उपायों को संदर्भित करता है कि फ़ंक्शन का अनुमानित लक्ष्य लक्ष्य फ़ंक्शन से कितनी अच्छी तरह मेल खाता है।

सीधे शब्दों में कहा जाए तो बाहरी डेटा गंभीर समस्याएं पैदा कर सकता है। कार्य करने के लिए एक मशीन लर्निंग प्रोजेक्ट स्थापित करने से पहले, अधिकारियों और अन्य हितधारकों को मंथन करने और यह पता लगाने की आवश्यकता है कि विशिष्ट प्रकार के डेटा क्या हैं जो आगे बढ़ने के लिए सही आधार प्रदान करेंगे।


मिथक # 2: हमारे पास जो डेटा है वह अच्छा है

फिर, मशीन सीखने की प्रक्रिया बहुत सटीक डेटा मॉडल पर काम करती है। जब तक यह स्पष्ट रूप से लक्षित, और पूर्वाग्रह और विचरण जैसी चीजों के लिए खाता नहीं है, तब तक डेटा पर्याप्त रूप से अच्छा नहीं है।

नो बग्स, नो स्ट्रेस - योर स्टेप बाय स्टेप गाइड बाय स्टेप गाइड टू लाइफ-चेंजिंग सॉफ्टवेर विदाउट योर लाइफ

जब कोई भी सॉफ़्टवेयर गुणवत्ता की परवाह नहीं करता है तो आप अपने प्रोग्रामिंग कौशल में सुधार कर सकते हैं।

मशीन सीखने की दुनिया में एक बात आपने बहुत सुनी है, वह है अनियंत्रित पूर्वाग्रह। मशीन लर्निंग हमारे मानव पूर्वाग्रहों को लेता है और उन आंकड़ों को मंथन करके उन्हें बढ़ाता है जो प्रोग्राम को संभावित चरम परिणामों में मिलता है।

इसका मतलब है कि इस प्रवृत्ति के लिए डेटा को अतिरिक्त लक्ष्य बनाना होगा।

मिथक # 3: यह हमारे लिए बहुत जल्दी है!

कुछ कंपनियों को चिंता है कि उनके लिए मशीन लर्निंग में काम करना जल्दबाजी होगी। लेकिन अगर आप बहुत सारे इनोवेटर्स और एंटरप्रेन्योर्स से बात करते हैं, तो वे कहेंगे कि यह ग्राउंड फ्लोर पर आने का सही समय है।

जहां कहीं भी आईटी प्रवृत्ति है, आप वक्र से आगे रहना चाहते हैं। मोहरा में सबसे अच्छी स्थिति है। सबकुछ सही होने का इंतजार लंबे समय में एक व्यवसाय का खर्च हो सकता है। (व्यवसाय के कारण अभी तक ML को लागू नहीं करने के और अधिक कारणों के बारे में जानने के लिए, 4 रोडब्लॉक देखें जो मशीन लर्निंग के स्टॉपिंग एडॉप्शन हैं।)

मिथक # ४: मशीन लर्निंग इज़ ऑलवेज सेम

निश्चित रूप से मशीन लर्निंग कार्यक्रमों की एक विस्तृत स्पेक्ट्रम है।

उनमें से कुछ अनिवार्य रूप से एक एकल एल्गोरिथ्म से भागते हैं - वे गणितीय रूप से सुपाठ्य और पारदर्शी हैं। इंजीनियर यह देख सकते हैं कि सिस्टम से बाहर आने वाले डेटा का सहसंबंध कैसे बनता है।

मशीन सीखने की अन्य प्रक्रियाएँ अधिक विस्तृत और समझने में कठिन हैं। कृत्रिम न्यूरॉन्स से बना तंत्रिका नेटवर्क अनिवार्य रूप से एक "ब्लैक बॉक्स" बन सकता है, जहां सबसे अच्छे इंजीनियरों के पास भी सिस्टम के माध्यम से डेटा को ट्रैक करने या एल्गोरिदम के काम करने के तरीके के बारे में बताने का कठिन समय होता है।

एरियल बेलिचर ने वैज्ञानिक निष्कर्षों पर लिखा है, "सबसे सक्षम तकनीकें - अर्थात् गहरे तंत्रिका नेटवर्क - कुख्यात अपारदर्शी हैं, जो अपने निष्कर्ष पर पहुंचने के तरीके के बारे में कुछ सुराग प्रदान करती हैं।"

इको स्टेट नेटवर्क जैसे उपकरण इस ब्लैक बॉक्स विचार को लेते हैं और इसके साथ चलते हैं। यह वास्तव में पूरी तरह से पूरी तरह से पता लगाना मुश्किल बनाता है कि ये सिस्टम कैसे काम करते हैं।

मिथक # 5: मशीन लर्निंग केवल सावधानीपूर्वक क्यूरेट डेटा के साथ काम करता है

हालांकि सटीक डेटा के बारे में उपरोक्त बिंदु अभी भी सही है, दो अलग-अलग प्रकार के मशीन लर्निंग मौलिक रूप से अलग-अलग आधार पर काम करते हैं।

एक प्रकार की मशीन लर्निंग जिसे लेबल किए गए डेटा के साथ पर्यवेक्षित मशीन लर्निंग कहा जाता है - प्रशिक्षण डेटा में पहले से ही इसके गुणों और श्रेणियों का वर्णन करने के लिए लेबल हैं।

मशीन लर्निंग का एक और प्रकार है, जिसे अनसुनी मशीन लर्निंग कहा जाता है। यह अनलिस्टेड डेटा से संबंधित है।

Unsupervised मशीन लर्निंग कच्चे डेटा लेता है, और मशीन अनिवार्य रूप से विशेषताओं के लिए इसका विश्लेषण करती है और इसे अपने आप श्रेणियों में समूह बनाती है। दोनों प्रकार के मशीन सीखने में बहुत अधिक संभावनाएं हैं, लेकिन पर्यवेक्षित मशीन सीखने के लिए लेबल किए गए डेटा के साथ एक प्रोग्राम सेट करना आसान है। Unsupervised मशीन सीखना कई कंपनियों के लिए अपरिवर्तित पानी की तरह है।

ये कुछ विचार हैं जो आपके पास हो सकते हैं, और मशीन सीखने के बारे में गलत धारणाएं जो उद्यम को अपनाने में समस्या पैदा कर सकती हैं। उम्मीद है कि इसने मशीन लर्निंग प्रोजेक्ट्स के बारे में कुछ भ्रम को दूर करने में मदद की है।