अक्सर पूछे जाने वाले प्रश्न
Potato के बारे में सामान्य प्रश्नों के उत्तर खोजें। जो खोज रहे हैं वह नहीं मिला? हमारे Discord में शामिल हों या दस्तावेज़ीकरण देखें।
शुरुआत करना
Potato (Portable Text Annotation Tool) उच्च-गुणवत्ता वाले डेटासेट बनाने के लिए एक मुफ़्त, ओपन-सोर्स एनोटेशन टूल है। यह एक सरल YAML-आधारित कॉन्फ़िगरेशन सिस्टम के साथ टेक्स्ट, इमेज, ऑडियो और वीडियो एनोटेशन का समर्थन करता है।
हां, Potato PolyForm Shield License 1.0.0 के तहत मुफ़्त और ओपन-सोर्स है। यह लाइसेंस अनुसंधान, शिक्षा और गैर-व्यावसायिक उद्देश्यों के लिए मुफ़्त उपयोग की अनुमति देता है।
कोई कोडिंग आवश्यक नहीं है। Potato YAML कॉन्फ़िगरेशन फ़ाइलों का उपयोग करता है जो मानव-पठनीय और लिखने में आसान हैं। हमारा Playground बिना कोई कोड लिखे कॉन्फ़िगरेशन बनाने के लिए एक विज़ुअल इंटरफ़ेस प्रदान करता है।
pip के माध्यम से इंस्टॉल करें: `pip install potato-annotation`। फिर अपना एनोटेशन सर्वर लॉन्च करने के लिए `potato start my_project -c config.yaml` चलाएं।
Potato के लिए Python 3.7 या उच्चतर आवश्यक है। सर्वोत्तम अनुभव के लिए हम Python 3.10+ का उपयोग करने की सलाह देते हैं।
डेटा और गोपनीयता
आपका डेटा आपकी मशीन पर रहता है। Potato पूरी तरह से स्थानीय रूप से चलता है और आपका डेटा कभी बाहरी सर्वर पर नहीं भेजता।
हां। चूंकि Potato स्व-होस्टेड है और स्थानीय रूप से चलता है, आप अपने डेटा पर पूर्ण नियंत्रण बनाए रखते हैं। कोई डेटा कभी आपके बुनियादी ढांचे को नहीं छोड़ता।
Potato सादे टेक्स्ट, JSON, JSONL, CSV, TSV, इमेज (PNG, JPG, GIF, WebP), ऑडियो (MP3, WAV, OGG), और वीडियो फ़ाइलों का समर्थन करता है।
एनोटेशन सुविधाएं
Potato समर्थन करता है: रेडियो बटन, चेकबॉक्स, लिकर्ट स्केल, टेक्स्ट इनपुट, स्पैन एनोटेशन, बाउंडिंग बॉक्स, पॉलीगॉन, पेयरवाइज़ तुलना, Best-Worst Scaling, और बहुत कुछ।
हां। एक एनोटेशन टास्क में एनोटेशन स्कीमा का कोई भी संयोजन शामिल हो सकता है।
हां। Potato इमेज वर्गीकरण, बाउंडिंग बॉक्स एनोटेशन और पॉलीगॉन एनोटेशन का समर्थन करता है।
हां। Potato एनोटेशन नियंत्रणों के साथ ऑडियो वेवफ़ॉर्म और वीडियो प्लेयर प्रदर्शित कर सकता है।
हाइलाइट करने के लिए टेक्स्ट के साथ अपने कॉन्फ़िग में स्पैन एनोटेशन स्कीम जोड़ें। एनोटेटर टेक्स्ट स्पैन चुन सकते हैं और लेबल असाइन कर सकते हैं।
एनोटेटर प्रबंधन
Potato डिफ़ॉल्ट रूप से एकाधिक एनोटेटर का समर्थन करता है। प्रत्येक एनोटेटर एक अद्वितीय ID के साथ लॉग इन करता है, और उनके एनोटेशन अलग-अलग ट्रैक किए जाते हैं।
हां। Potato Prolific और Amazon Mechanical Turk के साथ एकीकृत होता है।
एनोटेशन एक्सपोर्ट करें और मानक Python लाइब्रेरी का उपयोग करके एग्रीमेंट मेट्रिक्स (Cohen's Kappa, Krippendorff's Alpha, आदि) की गणना करें।
हां। आप ध्यान जांच आइटम जोड़ सकते हैं और एनोटेटर प्रगति की निगरानी के लिए एडमिन डैशबोर्ड का उपयोग कर सकते हैं।
LLM एकीकरण
हां। Potato OpenAI, Anthropic Claude, Google Gemini और Ollama के माध्यम से स्थानीय LLM के साथ एकीकृत होता है।
प्रदाता, मॉडल और प्रॉम्प्ट टेम्पलेट निर्दिष्ट करते हुए अपने कॉन्फ़िग में एक `llm` अनुभाग जोड़ें।
हां। Potato स्थानीय LLM चलाने के लिए Ollama का समर्थन करता है।
हां। एनोटेटर को मॉडल आउटपुट के बीच चुनाने के लिए पेयरवाइज़ तुलना का उपयोग करें, या प्रतिक्रिया गुणवत्ता रेट करने के लिए लिकर्ट स्केल का उपयोग करें।
डिप्लॉयमेंट
हां। इसे किसी भी सर्वर पर डिप्लॉय करें। HTTPS के लिए nginx या Apache के पीछे चलाएं, या कंटेनरीकृत डिप्लॉयमेंट के लिए Docker का उपयोग करें।
Potato को कस्टम Dockerfile का उपयोग करके कंटेनरीकृत किया जा सकता है।
हां। जब सर्वर पर डिप्लॉय किया जाता है, तो एकाधिक एनोटेटर एक साथ उसी Potato इंस्टेंस तक पहुंच सकते हैं।
Potato को एक रिवर्स प्रॉक्सी जैसे nginx या Caddy के पीछे डिप्लॉय करें जो SSL टर्मिनेशन संभालता है।
समस्या निवारण
जांचें कि आपका config.yaml वैध YAML है, आपकी डेटा फ़ाइल मौजूद है, पोर्ट उपयोग में नहीं है, और त्रुटियों के लिए टर्मिनल आउटपुट देखें।
जांचें कि आपने Save/Submit क्लिक किया, आउटपुट डायरेक्टरी लिखने योग्य है, और सभी आवश्यक फ़ील्ड भरे गए हैं।
आउटपुट डायरेक्टरी से एनोटेटर की एनोटेशन फ़ाइल हटा दें।
रीयल-टाइम सहायता के लिए हमारे Discord समुदाय में शामिल हों, ज्ञात समस्याओं के लिए GitHub Issues देखें, या हमारे दस्तावेज़ीकरण में ब्राउज़ करें।
अभी भी प्रश्न हैं?
हमारा समुदाय मदद के लिए यहाँ है। रीयल-टाइम समर्थन के लिए Discord में शामिल हों या विस्तृत गाइड के लिए दस्तावेज़ीकरण देखें।