अपाचे सुअर

लेखक: Robert Simon
निर्माण की तारीख: 16 जून 2021
डेट अपडेट करें: 13 मई 2024
Anonim
Apache Pig - Introduction
वीडियो: Apache Pig - Introduction

विषय

परिभाषा - अपाचे सुअर का क्या अर्थ है?

Apache Pig एक ऐसा प्लेटफ़ॉर्म है जिसका उपयोग बड़े डेटा सेट का विश्लेषण करने के लिए किया जाता है। इसमें डेटा विश्लेषण कार्यक्रमों को व्यक्त करने के लिए, इन कार्यक्रमों का मूल्यांकन करने के लिए बुनियादी ढांचे के साथ एक उच्च-स्तरीय भाषा शामिल है। सुअर की सबसे महत्वपूर्ण विशेषताओं में से एक यह है कि इसकी संरचना महत्वपूर्ण समानांतरकरण के लिए उत्तरदायी है।


सुअर Hadoop प्लेटफ़ॉर्म पर काम करता है, Hadoop वितरित फ़ाइल सिस्टम (HDFS) से डेटा लिखने और पढ़ने और एक या अधिक MapReduce नौकरियों के माध्यम से प्रसंस्करण का संचालन करता है। Apache Pig ओपन सोर्स के रूप में उपलब्ध है।

Apache Pig को Pig Programming Language या Hadoop Pig के नाम से भी जाना जाता है।

Microsoft Azure और Microsoft क्लाउड का परिचय | इस गाइड के दौरान, आप जानेंगे कि क्लाउड कंप्यूटिंग क्या है और Microsoft Azure आपको क्लाउड से अपना व्यवसाय चलाने और चलाने में कैसे मदद कर सकता है।

Techopedia Apache Pig की व्याख्या करता है

Apache Pig के दो भाग हैं: Pig Latin भाषा और Pig इंजन। पिग लैटिन भाषा एक स्क्रिप्टिंग भाषा है जो उपयोगकर्ताओं को एक या अधिक इनपुट से डेटा प्रवाह को पढ़ने और संसाधित करने के तरीके और उस स्थान को संग्रहीत करने के तरीके को चित्रित करने की अनुमति देती है।

सुअर लैटिन के कुछ प्रमुख गुण इस प्रकार हैं:

  • प्रोग्राम के लिए आसान: विभिन्न इंटरकनेक्टेड डेटा परिवर्तनों से मिलकर जटिल कार्य स्पष्ट रूप से डेटा प्रवाह अनुक्रम के रूप में एन्कोडेड हैं। यह उन्हें लिखने, समझने और बनाए रखने में सरल बनाता है।
  • अनुकूलन संभावनाएं: जिस तरीके से कार्य एन्कोड किए गए हैं, वह सिस्टम को स्वचालित निष्पादन का अनुकूलन करने की अनुमति देता है। इससे उपयोगकर्ता दक्षता के बजाय शब्दार्थ पर ध्यान दे सकता है।
  • एक्स्टेंसिबिलिटी: उपयोगकर्ताओं को विशेष-प्रयोजन प्रसंस्करण के लिए अपने स्वयं के कार्यों को बनाने की अनुमति है। पिग लैटिन में लिखे डेटा प्रवाह के निष्पादन के लिए पिग इंजन जिम्मेदार है। एक मानक संबंधपरक डेटाबेस प्रबंधन प्रणाली (RDBMS) डिजाइन की तरह, Apache Pig में एक पार्सर, ऑप्टिमाइज़र और टाइप चेकर होते हैं, जो ऑपरेटरों के अलावा डेटा प्रोसेसिंग करते हैं। सुअर में लेनदेन, डेटा कैटलॉग या सीधे डेटा स्टोरेज को संभालने या निष्पादन ढांचे को नियोजित करने की क्षमता शामिल नहीं है।