الأسئلة الشائعة
اعثر على إجابات للأسئلة الشائعة حول Potato. لم تجد ما تبحث عنه؟ انضم إلى Discord أو تصفّح التوثيق.
البدء السريع
Potato (أداة توسيم النصوص المحمولة) هو أداة توسيم مجانية ومفتوحة المصدر لإنشاء مجموعات بيانات عالية الجودة. يدعم توسيم النصوص والصور والصوت والفيديو بنظام إعداد بسيط يعتمد على YAML.
نعم، Potato مجاني ومفتوح المصدر بموجب رخصة PolyForm Shield 1.0.0. تسمح هذه الرخصة بالاستخدام المجاني للأغراض البحثية والتعليمية وغير التجارية. تتضمن الرخصة بند عدم المنافسة الذي يمنع استخدام Potato لبناء منصات توسيم منافسة. راجع ملف LICENSE في مستودع GitHub للتفاصيل الكاملة.
لا حاجة للبرمجة. يستخدم Potato ملفات إعداد YAML سهلة القراءة والكتابة. توفر بيئة التجربة واجهة مرئية لبناء الإعدادات دون كتابة أي كود.
ثبّته عبر pip: `pip install potato-annotation`. ثم شغّل `potato start my_project -c config.yaml` لتشغيل خادم التوسيم. راجع دليل البدء السريع للتعليمات التفصيلية.
يتطلب Potato إصدار Python 3.7 أو أعلى. نوصي باستخدام Python 3.10 أو أحدث للحصول على أفضل تجربة.
البيانات والخصوصية
تبقى بياناتك على جهازك. يعمل Potato بالكامل محلياً ولا يرسل بياناتك أبداً إلى خوادم خارجية. هذا يجعله مثالياً للبيانات الحساسة مثل السجلات الطبية أو المحتوى الخاص.
نعم. بما أن Potato مستضاف ذاتياً ويعمل محلياً، فإنك تحتفظ بالتحكم الكامل في بياناتك. لا تغادر أي بيانات بنيتك التحتية، مما يجعله مناسباً لمتطلبات HIPAA وGDPR وغيرها من متطلبات الامتثال.
يدعم Potato صيغ إدخال متنوعة تشمل النص العادي وJSON وJSONL وCSV وTSV والصور (PNG وJPG وGIF وWebP) والصوت (MP3 وWAV وOGG) وملفات الفيديو. يمكن تصدير المخرجات إلى JSON وJSONL وCSV وصيغ متخصصة مثل CoNLL وspaCy وCOCO ومجموعات بيانات HuggingFace.
ميزات التوسيم
يدعم Potato: أزرار الاختيار (اختيار فردي)، مربعات الاختيار (اختيار متعدد)، مقاييس ليكرت، إدخال نصي، توسيم نطاقي (تمييز النص)، مربعات الإحاطة، المضلعات، المقارنة الثنائية، مقياس الأفضل-الأسوأ، والمزيد. راجع معرض التصاميم للأمثلة.
نعم. يمكن لمهمة توسيم واحدة أن تتضمن أي مزيج من مخططات التوسيم. على سبيل المثال، يمكنك جعل الموسّمين يميّزون الكيانات (توسيم نطاقي)، ويصنّفون المشاعر (أزرار اختيار)، ويقدّمون تعليقات (إدخال نصي) كل ذلك على نفس العنصر.
نعم. يدعم Potato تصنيف الصور بتسميات أزرار الاختيار ومربعات الاختيار، وتوسيم مربعات الإحاطة لكشف الكائنات، وتوسيم المضلعات لمهام التجزئة.
نعم. يمكن لـ Potato عرض أشكال الموجات الصوتية ومشغّلات الفيديو بجانب عناصر التحكم في التوسيم. هذا مفيد لمراجعة النسخ النصي، وتحديد المتحدثين، وكشف المشاعر، والمهام المماثلة.
أضف مخطط توسيم نطاقي في ملف الإعداد مع النص المراد تمييزه. يمكن للموسّمين تحديد نطاقات نصية وتعيين تسميات لها. راجع أمثلة التعرف على الكيانات والتوسيم النطاقي في معرض التصاميم.
إدارة الموسّمين
يدعم Potato عدة موسّمين بشكل مباشر. يسجّل كل موسّم الدخول بمعرّف فريد، ويتم تتبع توسيماتهم بشكل منفصل. يمكنك إعداد التداخل لجعل عدة موسّمين يوسّمون نفس العناصر لمراقبة الجودة.
نعم. يتكامل Potato مع Prolific وAmazon Mechanical Turk. يُحوَّل الموسّمون من المنصة، ويُكملون المهام في Potato، ثم يُعادون برموز الإتمام.
يتتبع Potato العناصر التي وسّمها عدة موسّمين. يمكنك تصدير التوسيمات وحساب مقاييس الاتفاق (Cohen's Kappa وKrippendorff's Alpha وغيرها) باستخدام مكتبات Python القياسية.
نعم. يمكنك إضافة عناصر فحص الانتباه، وإعداد تداخل التوسيم المطلوب، واستخدام لوحة تحكم المسؤول لمراقبة تقدّم الموسّمين وتحديد المشكلات المحتملة.
تكامل نماذج اللغة الكبيرة
نعم. يتكامل Potato مع OpenAI وAnthropic Claude وGoogle Gemini ونماذج اللغة الكبيرة المحلية عبر Ollama. يمكنك إعداد التوسيم المسبق بالذكاء الاصطناعي لتسريع سير عمل التوسيم البشري.
أضف قسم `llm` في ملف الإعداد محدداً المزوّد والنموذج وقالب المطالبة. سيستدعي Potato واجهة برمجة تطبيقات نموذج اللغة الكبيرة لكل عنصر ويملأ حقول التوسيم مسبقاً ليقبلها الموسّمون أو يصححوها.
نعم. يدعم Potato تشغيل Ollama لتشغيل نماذج اللغة الكبيرة محلياً. هذا يحافظ على خصوصية بياناتك بالكامل مع الاستفادة من مساعدة الذكاء الاصطناعي.
نعم. Potato مناسب تماماً لجمع بيانات التفضيل البشري لـ RLHF. استخدم المقارنة الثنائية لجعل الموسّمين يختارون بين مخرجات النماذج، أو مقاييس ليكرت لتقييم جودة الاستجابات.
النشر
نعم. بينما يعمل Potato محلياً افتراضياً، يمكنك نشره على أي خادم. شغّله خلف nginx أو Apache لدعم HTTPS، أو استخدم Docker للنشر في حاويات.
يمكن وضع Potato في حاوية باستخدام Dockerfile مخصص. بينما لا نوفر حالياً صور Docker رسمية، يمكنك إنشاء صورتك الخاصة باستخدام صورة Python أساسية قياسية. راجع توثيق النشر للأمثلة.
نعم. عند النشر على خادم، يمكن لعدة موسّمين الوصول إلى نفس مثيل Potato في وقت واحد. يتم تتبع عمل كل موسّم بشكل منفصل.
انشر Potato خلف وكيل عكسي مثل nginx أو Caddy الذي يتولى إنهاء SSL. راجع دليل النشر لأمثلة الإعداد.
استكشاف الأخطاء وإصلاحها
المشكلات الشائعة: 1) تحقق من أن config.yaml يحتوي على صيغة YAML صالحة. 2) تأكد من وجود ملف البيانات وتنسيقه بشكل صحيح. 3) تحقق من أن المنفذ (الافتراضي 8000) ليس قيد الاستخدام. 4) اطّلع على مخرجات الطرفية لرسائل الخطأ المحددة.
تحقق من: 1) أنك ضغطت زر الحفظ/الإرسال. 2) أن مجلد المخرجات قابل للكتابة. 3) أن جميع الحقول المطلوبة مملوءة. تحقق من وحدة تحكم المتصفح لأخطاء JavaScript.
احذف ملف توسيمات الموسّم من مجلد المخرجات. سيُعاد إنشاء تعيينه عند تسجيل الدخول التالي.
انضم إلى مجتمع Discord للمساعدة الفورية، أو تحقق من مشكلات GitHub للمشكلات المعروفة، أو تصفّح التوثيق. المجتمع ودود ومتجاوب!
لا تزال لديك أسئلة؟
مجتمعنا هنا للمساعدة. انضم إلى Discord للدعم الفوري أو تصفّح التوثيق للأدلة التفصيلية.