Skip to content

ما الجديد

نظرة عامة على الميزات الجديدة والتحسينات في إصدارات Potato v2.x.

ما الجديد

تغطي هذه الصفحة الميزات الجديدة والتحسينات عبر إصدارات Potato v2.x.


Potato 2.2.0

صدر في 20 فبراير 2026

Potato 2.2 هو إصدار رئيسي يتضمن 9 مخططات توسيم جديدة، ونظام تصدير قابل للتوسيع، وتقدير كفاءة MACE، و55 أداة استبيان محققة، ومصادر بيانات عن بُعد.

مخططات التوسيم الجديدة (9)

توسيم الأحداث — هياكل أحداث متعددة العلاقات مع نطاقات محفزة وأدوار حجج مصنفة. وسِّم أحداثًا مثل ATTACK وHIRE وTRAVEL مع حجج كيانات مقيدة وتصور أقواس محورية.

yaml
annotation_schemes:
  - annotation_type: event_annotation
    name: events
    span_schema: entities
    event_types:
      - type: "ATTACK"
        trigger_labels: ["EVENT_TRIGGER"]
        arguments:
          - role: "attacker"
            entity_types: ["PERSON", "ORGANIZATION"]
            required: true

تعرّف على المزيد حول توسيم الأحداث ←

ربط الكيانات — اربط التوسيمات النطاقية بقواعد المعرفة الخارجية (Wikidata وUMLS وREST APIs مخصصة). أضف كتلة entity_linking: لأي مخطط نطاقي لتفعيل البحث والربط بقاعدة المعرفة.

تعرّف على المزيد حول ربط الكيانات ←

الفرز — واجهة قبول/رفض/تخطي بأسلوب Prodigy للفحص السريع للبيانات. تسميات قابلة للتخصيص، واختصارات لوحة المفاتيح، وتقدم تلقائي للتوسيم عالي الإنتاجية.

تعرّف على المزيد حول الفرز ←

المقارنة الزوجية — قارن عنصرين بوضع ثنائي (انقر على البلاطة المفضلة) أو مقياس (شريط تمرير). يدعم items_key وallow_tie وكتلة scale: مع نطاق قابل للتعديل.

تعرّف على المزيد حول المقارنة الزوجية ←

أشجار المحادثات — وسِّم هياكل المحادثات الهرمية مع تقييمات لكل عقدة، واختيار المسار، ومقارنة الفروع.

تعرّف على المزيد حول أشجار المحادثات ←

سلاسل الإشارة المرجعية المشتركة — جمّع إشارات النص المتطابقة في سلاسل مع مؤشرات مرئية. يدعم أنواع الكيانات، والتحكم في المفردات، وأوضاع تمييز متعددة.

تعرّف على المزيد حول سلاسل الإشارة المرجعية المشتركة ←

أقنعة التجزئة — أدوات fill وeraser وbrush جديدة لتجزئة الصور على مستوى البكسل.

مربعات الإحاطة لمستندات PDF — ارسم مربعات على صفحات PDF لمهام توسيم المستندات.

النطاقات غير المتصلةallow_discontinuous: true يتيح تحديد أجزاء نصية غير متجاورة كنطاق واحد.


التوسيم الذكي

تقدير كفاءة MACE — خوارزمية بايز المتغيرة EM التي تقدّر بشكل مشترك التسميات الحقيقية ودرجات كفاءة الموسِّمين (0.0-1.0). تعمل مع مخططات radio وlikert وselect وmultiselect.

yaml
mace:
  enabled: true
  trigger_every_n: 10
  min_annotations_per_item: 3

تعرّف على المزيد حول MACE ←

تمييز الخيارات — تمييز قائم على نماذج اللغة الكبيرة للخيارات المحتملة الصحيحة لمهام التوسيم المنفصلة. يميّز أفضل k خيارات بمؤشر نجمة مع تعتيم الخيارات الأقل احتمالاً.

yaml
ai_support:
  option_highlighting:
    enabled: true
    top_k: 3
    dim_opacity: 0.4

تعرّف على المزيد حول تمييز الخيارات ←

الترتيب التنوعي — تجميع قائم على التضمينات وأخذ عينات دوري لضمان رؤية الموسِّمين لمحتوى متنوع بدلاً من عناصر متشابهة متتالية.

yaml
assignment_strategy: diversity_clustering
diversity_ordering:
  enabled: true
  prefill_count: 100

تعرّف على المزيد حول الترتيب التنوعي ←


نظام التصدير

أداة تصدير جديدة عبر سطر الأوامر (python -m potato.export) تحول التوسيمات إلى 6 صيغ معيارية: COCO وYOLO وPascal VOC وCoNLL-2003 وCoNLL-U وأقنعة التجزئة.

bash
python -m potato.export --config config.yaml --format coco --output ./export/

تعرّف على المزيد حول صيغ التصدير ←


مصادر البيانات عن بُعد

حمّل بيانات التوسيم من عناوين URL وS3 وGoogle Drive وDropbox وHugging Face وGoogle Sheets وقواعد بيانات SQL عبر كتلة إعدادات data_sources: الجديدة. يتضمن التحميل الجزئي والتخزين المؤقت وإدارة بيانات الاعتماد.

تعرّف على المزيد حول مصادر البيانات عن بُعد ←


أدوات الاستبيان

55 استبيانًا محققًا عبر 8 فئات (الشخصية، الصحة النفسية، المشاعر، مفهوم الذات، المواقف الاجتماعية، أسلوب الاستجابة، النماذج المختصرة، الديموغرافيا). استخدمها في مراحل ما قبل/بعد الدراسة مع instrument: "tipi".

تعرّف على المزيد حول أدوات الاستبيان ←


تحسينات أخرى

  • تتبع كائنات الفيديو مع استيفاء الإطارات المفتاحية
  • دعم ملف إعدادات AI خارجي
  • تحسينات تخطيط شبكة النماذج
  • معالجات صيغ لملفات PDF وWord والكود وجداول البيانات

Potato 2.1.0

صدر في 5 فبراير 2026

Potato 2.1 يقدم نظام عرض العناصر، ودعم الذكاء الاصطناعي البصري، وربط النطاقات، وتوسيم النطاقات متعدد الحقول، وتخصيص التخطيط.

نظام عرض العناصر

كتلة إعدادات instance_display جديدة تفصل عرض المحتوى عن التوسيم. اعرض أي مجموعة من الصور والفيديوهات والصوت والنصوص والحوارات بجانب أي مخططات توسيم.

yaml
instance_display:
  fields:
    - key: image_url
      type: image
      display_options:
        max_width: 600
        zoomable: true
    - key: description
      type: text
 
annotation_schemes:
  - annotation_type: radio
    name: category
    labels: [nature, urban, people]

يدعم 11 نوع عرض بما في ذلك text وhtml وimage وvideo وaudio وdialogue وpairwise وcode وspreadsheet وdocument وpdf.

تعرّف على المزيد حول عرض العناصر ←


توسيم النطاقات متعدد الحقول

تدعم مخططات توسيم النطاقات الآن خيار target_field للتوسيم عبر حقول نصية متعددة في نفس العنصر.

yaml
annotation_schemes:
  - annotation_type: span
    name: source_entities
    target_field: "source_text"
    labels: [PERSON, ORGANIZATION]
 
  - annotation_type: span
    name: summary_entities
    target_field: "summary"
    labels: [PERSON, ORGANIZATION]

تعرّف على المزيد حول توسيم النطاقات ←


ربط النطاقات

نوع توسيم span_link جديد لإنشاء علاقات مصنفة بين النطاقات الموسّمة. يدعم الروابط الموجهة وغير الموجهة، والعلاقات المتعددة، وعرض الأقواس المرئي، وقيود التسميات.

yaml
annotation_schemes:
  - annotation_type: span
    name: entities
    labels:
      - name: "PERSON"
        color: "#3b82f6"
      - name: "ORGANIZATION"
        color: "#22c55e"
 
  - annotation_type: span_link
    name: relations
    span_schema: entities
    link_types:
      - name: "WORKS_FOR"
        directed: true
        allowed_source_labels: ["PERSON"]
        allowed_target_labels: ["ORGANIZATION"]
        color: "#dc2626"

تعرّف على المزيد حول ربط النطاقات ←


دعم الذكاء الاصطناعي البصري

أربع نقاط نهاية جديدة للرؤية لمساعدة التوسيم بالذكاء الاصطناعي للصور والفيديو:

  • YOLO — كشف الكائنات المحلي السريع
  • Ollama Vision — نماذج لغة-رؤية محلية (LLaVA، Qwen-VL)
  • OpenAI Vision — رؤية GPT-4o السحابية
  • Anthropic Vision — Claude مع الرؤية

تشمل الميزات كشف الكائنات، والتوسيم المسبق، والتصنيف، والتلميحات، وكشف المشاهد، وكشف الإطارات المفتاحية، وتتبع الكائنات.

تعرّف على المزيد حول دعم الذكاء الاصطناعي البصري ←


تخصيص التخطيط

أنشئ تخطيطات مرئية مخصصة متطورة باستخدام قوالب HTML وCSS. ينشئ Potato ملف تخطيط قابلاً للتعديل، أو يمكنك تقديم قالب مخصص بالكامل مع تخطيطات شبكية وخيارات ملونة وتنسيق أقسام.

yaml
task_layout: layouts/custom_task_layout.html

ثلاثة تخطيطات مثالية مضمنة: إشراف المحتوى، وسؤال وجواب الحوار، والمراجعة الطبية.

تعرّف على المزيد حول تخصيص التخطيط ←


مبررات التسميات

قدرة ذكاء اصطناعي رابعة تولّد تفسيرات متوازنة لسبب تطبيق كل تسمية، مما يساعد الموسِّمين على فهم وجهات نظر التصنيف المختلفة.

yaml
ai_support:
  features:
    rationales:
      enabled: true

تعرّف على المزيد حول دعم الذكاء الاصطناعي ←


تحسينات أخرى

  • أكثر من 50 اختبارًا جديدًا لتحسين الموثوقية
  • تحسينات التصميم المتجاوب
  • تنظيم محسّن لمركز المشاريع مع أمثلة تخطيط
  • إصلاح أخطاء عبر أنواع التوسيم

مقارنة الإصدار 2.0 مع 2.1

الميزةv2.0v2.1
عرض العناصرعبر حلول بديلةكتلة instance_display مخصصة
أهداف النطاقاتحقل نصي واحدحقول متعددة مع target_field
ربط النطاقاتغير متاحنوع span_link كامل
الذكاء الاصطناعي البصريغير متاحYOLO، Ollama Vision، OpenAI Vision، Anthropic Vision
تخصيص التخطيطأساسي تلقائيتلقائي + قوالب مخصصة
قدرات الذكاء الاصطناعي3 (تلميحات، كلمات مفتاحية، اقتراحات)4 (+ مبررات)

Potato 2.0

Potato 2.0 هو إصدار رئيسي يقدم ميزات قوية جديدة للتوسيم الذكي والقابل للتوسع. يسلط هذا القسم الضوء على الإضافات والتحسينات الرئيسية.

دعم الذكاء الاصطناعي

ادمج نماذج اللغة الكبيرة لمساعدة الموسِّمين بتلميحات ذكية، وتمييز الكلمات المفتاحية، واقتراحات التسميات.

المزودون المدعومون:

  • OpenAI (GPT-4، GPT-3.5)
  • Anthropic (Claude 3، Claude 3.5)
  • Google (Gemini)
  • Ollama (نماذج محلية)
  • vLLM (مستضاف ذاتيًا)
yaml
ai_support:
  enabled: true
  endpoint_type: openai
  ai_config:
    model: gpt-4
    api_key: ${OPENAI_API_KEY}
  features:
    hints:
      enabled: true
    label_suggestions:
      enabled: true

تعرّف على المزيد حول دعم الذكاء الاصطناعي ←


توسيم الصوت

توسيم صوتي كامل الميزات مع تصور الموجة الصوتية بدعم Peaks.js. أنشئ مقاطع، ووسِّم مناطق زمنية، ووسِّم الكلام باختصارات لوحة المفاتيح.

الميزات الرئيسية:

  • تصور الموجة الصوتية
  • إنشاء المقاطع وتوسيمها
  • أسئلة توسيم لكل مقطع
  • أكثر من 15 اختصار لوحة مفاتيح
  • تخزين الموجة الصوتية مؤقتًا على الخادم
yaml
annotation_schemes:
  - annotation_type: audio
    name: speakers
    mode: label
    labels:
      - Speaker A
      - Speaker B

تعرّف على المزيد حول توسيم الصوت ←


التعلم النشط

رتّب عناصر التوسيم تلقائيًا حسب عدم يقين النموذج. درّب المصنفات على التوسيمات الموجودة وركّز جهود الموسِّمين على الأمثلة الأكثر إفادة.

القدرات:

  • خيارات مصنفات متعددة (LogisticRegression، RandomForest، SVC، MultinomialNB)
  • محولات متجهية متنوعة (TF-IDF، Count، Hashing)
  • استمرارية النموذج عبر عمليات إعادة التشغيل
  • اختيار محسّن بنماذج اللغة الكبيرة
  • دعم مخططات متعددة
yaml
active_learning:
  enabled: true
  schema_names:
    - sentiment
  min_instances_for_training: 30
  update_frequency: 50
  classifier:
    type: LogisticRegression

تعرّف على المزيد حول التعلم النشط ←


مرحلة التدريب

أهّل الموسِّمين بأسئلة تدريبية قبل المهمة الرئيسية. قدّم ملاحظات فورية وضمان الجودة من خلال معايير نجاح قابلة للتعديل.

الميزات:

  • أسئلة تدريبية بإجابات معروفة
  • ملاحظات وتفسيرات فورية
  • معايير نجاح قابلة للتعديل
  • خيارات إعادة المحاولة
  • تتبع التقدم في لوحة الإدارة
yaml
phases:
  training:
    enabled: true
    data_file: "data/training.json"
    passing_criteria:
      min_correct: 8
      total_questions: 10

تعرّف على المزيد حول مرحلة التدريب ←


لوحة الإدارة المحسّنة

واجهة شاملة للمراقبة والإدارة لمهام التوسيم.

علامات تبويب اللوحة:

  • نظرة عامة: مقاييس عالية المستوى ومعدلات الإنجاز
  • الموسِّمون: تتبع الأداء وتحليل التوقيت
  • العناصر: تصفح البيانات مع درجات الاختلاف
  • الإعدادات: ضبط الإعدادات في الوقت الفعلي
yaml
admin_api_key: ${ADMIN_API_KEY}

تعرّف على المزيد حول لوحة الإدارة ←


قاعدة البيانات الخلفية

دعم MySQL للنشر واسع النطاق مع تجميع الاتصالات ودعم المعاملات.

yaml
database:
  type: mysql
  host: localhost
  database: potato_db
  user: ${DB_USER}
  password: ${DB_PASSWORD}

ينشئ Potato الجداول المطلوبة تلقائيًا عند التشغيل الأول.


سجل التوسيم

تتبع كامل لجميع تغييرات التوسيم مع الطوابع الزمنية ومعرفات المستخدمين وأنواع الإجراءات. يتيح التدقيق والتحليل السلوكي.

json
{
  "history": [
    {
      "timestamp": "2024-01-15T10:30:00Z",
      "user": "annotator_1",
      "action": "create",
      "schema": "sentiment",
      "value": "Positive"
    }
  ]
}

سير العمل متعدد المراحل

أنشئ سير عمل توسيم معقدة بمراحل متتابعة:

  1. الموافقة - جمع الموافقة المستنيرة
  2. ما قبل الدراسة - البيانات الديموغرافية والفحص
  3. التعليمات - إرشادات المهمة
  4. التدريب - أسئلة تدريبية
  5. التوسيم - المهمة الرئيسية
  6. ما بعد الدراسة - استبيانات الملاحظات
yaml
phases:
  consent:
    enabled: true
    data_file: "data/consent.json"
  prestudy:
    enabled: true
    data_file: "data/demographics.json"
  training:
    enabled: true
    data_file: "data/training.json"
  poststudy:
    enabled: true
    data_file: "data/feedback.json"

تعرّف على المزيد حول سير العمل متعدد المراحل ←


تغييرات إعدادات الإصدار 2.0

هيكل الإعدادات الجديد

يستخدم Potato 2.0 صيغة إعدادات أنظف:

v1 (القديم):

yaml
data_files:
  - data.json
id_key: id
text_key: text
output_file: annotations.json

v2 (الجديد):

yaml
data_files:
  - "data/data.json"
 
item_properties:
  id_key: id
  text_key: text
 
output_annotation_dir: "output/"
output_annotation_format: "json"

متطلبات الأمان

يجب أن تكون ملفات الإعدادات الآن داخل task_dir:

yaml
# Valid - config.yaml is in the project directory
task_dir: "."
 
# Valid - config in configs/ subdirectory
task_dir: "my_project/"

مقارنة سريعة

الميزةv1v2.0v2.1v2.2
دعم الذكاء الاصطناعي/نماذج اللغة الكبيرةلانعمنعم + ذكاء اصطناعي بصري + مبررات+ تمييز الخيارات
توسيم الصوتأساسيموجة صوتية كاملةموجة صوتية كاملةموجة صوتية كاملة
التعلم النشطلانعمنعمنعم + ترتيب تنوعي
عرض العناصرلالانعمنعم
ربط النطاقاتلالانعمنعم
توسيم الأحداثلالالانعم
ربط الكياناتلالالانعم
مقارنة زوجية/فرز/إشارة مرجعية/أشجارلالالانعم
تخصيص التخطيطلاتلقائيتلقائي + قوالب مخصصةتلقائي + قوالب مخصصة
مرحلة التدريبلانعمنعمنعم
لوحة الإدارةأساسيةمحسّنةمحسّنةمحسّنة + MACE
قاعدة البيانات الخلفيةملفات فقطملفات + MySQLملفات + MySQLملفات + MySQL
أداة التصديرلالالانعم (COCO، YOLO، CoNLL، إلخ)
أدوات الاستبيانلالالا55 استبيانًا محققًا
مصادر البيانات عن بُعدلالالاS3، GDrive، HuggingFace، إلخ

دليل الترحيل

تحديث إعداداتك (من v1 إلى v2)

  1. إعدادات البيانات

    yaml
    # Old
    id_key: id
    text_key: text
     
    # New
    item_properties:
      id_key: id
      text_key: text
  2. إعدادات المخرجات

    yaml
    # Old
    output_file: annotations.json
     
    # New
    output_annotation_dir: "output/"
    output_annotation_format: "json"
  3. موقع ملف الإعدادات تأكد من أن ملف الإعدادات داخل مجلد المشروع.

بدء تشغيل الخادم

bash
# v2 command
python -m potato start config.yaml -p 8000
 
# Or shorthand
potato start config.yaml

البدء

هل أنت مستعد لتجربة Potato؟ ابدأ مع دليل البدء السريع أو استكشف ميزات محددة:

ميزات v2.2:

ميزات v2.1:

الميزات الأساسية: