Hadoop वितरित फ़ाइल सिस्टम (HDFS)

लेखक: Judy Howell
निर्माण की तारीख: 28 जुलाई 2021
डेट अपडेट करें: 1 जुलाई 2024
Anonim
Introduction to Hadoop Distributed File System (HDFS)
वीडियो: Introduction to Hadoop Distributed File System (HDFS)

विषय

परिभाषा - Hadoop डिस्ट्रिब्यूटेड फाइल सिस्टम (HDFS) का क्या अर्थ है?

Hadoop डिस्ट्रिब्यूटेड फाइल सिस्टम (HDFS) एक वितरित फाइल सिस्टम है जो मानक या निम्न-अंत हार्डवेयर पर चलता है। Apache Hadoop द्वारा विकसित, HDFS एक मानक वितरित फ़ाइल सिस्टम की तरह काम करता है, लेकिन MapReduce एल्गोरिथ्म, उच्च दोष सहिष्णुता और बड़े डेटा सेटों के मूल समर्थन के माध्यम से बेहतर डेटा थ्रूपुट और एक्सेस प्रदान करता है।


Microsoft Azure और Microsoft क्लाउड का परिचय | इस गाइड के दौरान, आप जानेंगे कि क्लाउड कंप्यूटिंग क्या है और Microsoft Azure आपको क्लाउड से अपना व्यवसाय चलाने और चलाने में कैसे मदद कर सकता है।

Techopedia बताता है कि Hadoop डिस्ट्रिब्यूटेड फाइल सिस्टम (HDFS)

HDFS कई मशीनों में रखे गए डेटा की एक बड़ी मात्रा को संग्रहीत करता है, आमतौर पर सैकड़ों और हजारों एक साथ जुड़े नोड्स में, और प्रत्येक डेटा आवृत्ति को तीन अलग-अलग प्रतियों के रूप में दोहराकर डेटा विश्वसनीयता प्रदान करता है - दो एक समूह में और एक दूसरे में। विफलता की स्थिति में इन प्रतियों को बदला जा सकता है।

HDFS आर्किटेक्चर में क्लस्टर होते हैं, जिनमें से प्रत्येक उस क्लस्टर फाइल सिस्टम और उपयोगकर्ता पहुंच तंत्र की निगरानी और प्रबंधन के लिए एक अलग मशीन पर स्थापित एक NameNode सॉफ्टवेयर टूल के माध्यम से एक्सेस किया जाता है। क्लस्टर संग्रहण को प्रबंधित करने के लिए अन्य मशीनें DataNode का एक उदाहरण स्थापित करती हैं।

क्योंकि एचडीएफएस जावा में लिखा गया है, इसमें एप्लिकेशन एकीकरण और पहुंच के लिए जावा एप्लिकेशन प्रोग्रामिंग इंटरफेस (एपीआई) के लिए मूल समर्थन है। इसे मानक वेब ब्राउज़र के माध्यम से भी एक्सेस किया जा सकता है।