Skip to content

أساسيات الإعدادات

تعلّم أساسيات ملفات إعدادات Potato.

أساسيات الإعدادات

يستخدم Potato ملفات إعدادات YAML لتعريف مهام التوسيم. يغطي هذا الدليل خيارات الإعدادات الأساسية.

هيكل ملف الإعدادات

يتكون إعداد Potato الأساسي من هذه الأقسام الرئيسية:

yaml
# Task settings
annotation_task_name: "My Annotation Task"
port: 8000
 
# Data configuration
data_files:
  - data.json
 
item_properties:
  id_key: id
  text_key: text
 
# Output settings
output_annotation_dir: "annotation_output/"
output_annotation_format: "json"
 
# Annotation schemes
annotation_schemes:
  - annotation_type: radio
    name: my_annotation
    labels:
      - Label 1
      - Label 2
 
# User settings
allow_all_users: true

الإعدادات الأساسية

إعدادات المهمة والخادم

yaml
annotation_task_name: "My Task"  # Display name for your task
port: 8000                       # Port to run the server on

إعدادات البيانات

yaml
data_files:
  - data.json           # Path to your data file(s)
  - more_data.json      # You can specify multiple files
 
item_properties:
  id_key: id            # Field containing unique ID
  text_key: text        # Field containing text to annotate

صيغ البيانات المدعومة:

  • JSON (.json)
  • JSON Lines (.jsonl)
  • CSV (.csv)
  • TSV (.tsv)

إعدادات المخرجات

yaml
output_annotation_dir: "annotation_output/"   # Directory for annotation files
output_annotation_format: "json"              # Format: json, jsonl, csv, tsv

مخططات التوسيم

حدد مخططًا واحدًا أو أكثر للتوسيم:

yaml
annotation_schemes:
  - annotation_type: radio      # Type of annotation
    name: sentiment             # Internal name
    description: "Select the sentiment"  # Instructions
    labels:                     # Options for annotators
      - Positive
      - Negative
      - Neutral

أنواع التوسيم المتاحة

النوعالوصف
radioاختيار واحد
multiselectاختيار متعدد
likertتقييم على مقياس
textإدخال نص حر
numberإدخال رقمي
spanتمييز نطاقات النص
sliderاختيار نطاق مستمر
multirateتقييم عناصر متعددة

إعدادات المستخدمين

السماح لجميع المستخدمين

yaml
allow_all_users: true

تقييد الوصول لمستخدمين محددين

yaml
allow_all_users: false
authorized_users:
  - user1@example.com
  - user2@example.com

مجلد المهمة

يحدد إعداد task_dir المجلد الجذر للمسارات النسبية:

yaml
task_dir: ./my-task/
data_files:
  - data/input.json    # Resolves to ./my-task/data/input.json

مثال كامل

إليك إعدادًا كاملاً لمهمة تحليل المشاعر:

yaml
# config.yaml
annotation_task_name: "Sentiment Analysis"
port: 8000
task_dir: ./
 
# Data
data_files:
  - data/tweets.json
 
item_properties:
  id_key: id
  text_key: text
  context_key: metadata
 
# Output
output_annotation_dir: "annotation_output/"
output_annotation_format: "json"
 
# Annotation
annotation_schemes:
  - annotation_type: radio
    name: sentiment
    description: "What is the sentiment expressed in this tweet?"
    labels:
      - name: Positive
        key_value: "1"
      - name: Negative
        key_value: "2"
      - name: Neutral
        key_value: "3"
    sequential_key_binding: true
 
# Users
allow_all_users: true
 
# Assignment
instances_per_annotator: 100
annotation_per_instance: 2

الخطوات التالية