Skip to content
Guides4 min read

دمج نماذج اللغة الكبيرة لتلميحات التوسيم الذكية

تعلم كيفية استخدام OpenAI أو Claude أو Gemini لتقديم تلميحات واقتراحات ذكية للمُوسِّمين.

Potato Team·

دمج نماذج اللغة الكبيرة لتلميحات التوسيم الذكية

يمكن للتوسيم المدعوم بالذكاء الاصطناعي تحسين كل من السرعة والجودة بشكل كبير. يغطي هذا الدليل دمج OpenAI و Claude و Gemini والنماذج المحلية لتقديم اقتراحات ذكية للمُوسِّمين.

ما يتيحه دمج نماذج اللغة الكبيرة

  • اقتراحات التوسيم المسبق: الذكاء الاصطناعي يقدم تسميات أولية للمراجعة
  • تمييز الكلمات المفتاحية: تمييز المصطلحات ذات الصلة تلقائياً
  • تلميحات الجودة: الإشارة إلى أخطاء التوسيم المحتملة
  • توليد التوضيحات: مساعدة المُوسِّمين على فهم الحالات الصعبة

تكامل OpenAI الأساسي

yaml
annotation_task_name: "AI-Assisted Sentiment Analysis"
 
# AI configuration
ai_support:
  enabled: true
  endpoint_type: openai
 
  ai_config:
    model: gpt-4
    api_key: ${OPENAI_API_KEY}
    temperature: 0.3
    max_tokens: 500
 
  features:
    hints:
      enabled: true
    keyword_highlighting:
      enabled: true
    label_suggestions:
      enabled: true
 
# ... rest of config
annotation_schemes:
  - annotation_type: radio
    name: sentiment
    labels: [Positive, Negative, Neutral]

المزودون المدعومون

OpenAI

yaml
ai_support:
  enabled: true
  endpoint_type: openai
 
  ai_config:
    model: gpt-4  # or gpt-4o, gpt-3.5-turbo
    api_key: ${OPENAI_API_KEY}
    temperature: 0.3
    max_tokens: 500

Anthropic Claude

yaml
ai_support:
  enabled: true
  endpoint_type: anthropic
 
  ai_config:
    model: claude-3-sonnet-20240229
    api_key: ${ANTHROPIC_API_KEY}
    temperature: 0.3
    max_tokens: 500

Google Gemini

yaml
ai_support:
  enabled: true
  endpoint_type: google
 
  ai_config:
    model: gemini-1.5-pro
    api_key: ${GOOGLE_API_KEY}

النماذج المحلية (Ollama)

yaml
ai_support:
  enabled: true
  endpoint_type: ollama
 
  ai_config:
    model: llama2  # or mistral, mixtral, etc.
    base_url: http://localhost:11434

الميزة: اقتراحات التسميات

يمكن لنماذج الذكاء الاصطناعي اقتراح تسميات لنظر المُوسِّم:

yaml
ai_support:
  enabled: true
  endpoint_type: openai
 
  ai_config:
    model: gpt-4
    api_key: ${OPENAI_API_KEY}
 
  features:
    label_suggestions:
      enabled: true
      show_confidence: true
 
annotation_schemes:
  - annotation_type: radio
    name: category
    labels: [News, Opinion, Satire, Other]

الميزة: تمييز الكلمات المفتاحية

تمييز المصطلحات المهمة تلقائياً:

yaml
ai_support:
  enabled: true
  endpoint_type: openai
 
  ai_config:
    model: gpt-4
    api_key: ${OPENAI_API_KEY}
 
  features:
    keyword_highlighting:
      enabled: true

الميزة: التلميحات الذكية

تقديم إرشاد سياقي للمُوسِّمين:

yaml
ai_support:
  enabled: true
  endpoint_type: openai
 
  ai_config:
    model: gpt-4
    api_key: ${OPENAI_API_KEY}
 
  features:
    hints:
      enabled: true

تظهر التلميحات كإرشاد سياقي دون الكشف عن الإجابة، مما يساعد المُوسِّمين على التفكير في الحالات الصعبة.

تكوين كامل مدعوم بالذكاء الاصطناعي

yaml
annotation_task_name: "AI-Assisted NER Annotation"
 
# AI Configuration
ai_support:
  enabled: true
  endpoint_type: openai
 
  ai_config:
    model: gpt-4
    api_key: ${OPENAI_API_KEY}
    temperature: 0.2
    max_tokens: 500
 
  features:
    hints:
      enabled: true
    keyword_highlighting:
      enabled: true
    label_suggestions:
      enabled: true
      show_confidence: true
 
  cache_config:
    disk_cache:
      enabled: true
      path: "ai_cache/cache.json"
    prefetch:
      warm_up_page_count: 50
      on_next: 5
      on_prev: 2
 
data_files:
  - data/texts.json
 
item_properties:
  id_key: id
  text_key: content
 
annotation_schemes:
  - annotation_type: span
    name: entities
    description: "Label named entities (AI suggestions provided)"
    labels:
      - name: PERSON
        color: "#FF6B6B"
      - name: ORG
        color: "#4ECDC4"
      - name: LOC
        color: "#45B7D1"
      - name: DATE
        color: "#96CEB4"
 
output_annotation_dir: "annotation_output/"
output_annotation_format: "json"

العمل مع اقتراحات الذكاء الاصطناعي

عندما يكون دعم الذكاء الاصطناعي مفعلاً، يرى المُوسِّمون الاقتراحات بجانب واجهة التوسيم. يمكنهم قبول أو تعديل أو تجاهل توصيات الذكاء الاصطناعي. التوسيم النهائي يعكس دائماً قرار المُوسِّم، مما يضمن الإشراف البشري.

يتم تخزين استجابات الذكاء الاصطناعي مؤقتاً تلقائياً عند تفعيل التخزين المؤقت، بحيث لا تؤدي نفس العينة إلى استدعاءات API متعددة.

الأوامر المخصصة

يتضمن Potato أوامر افتراضية لكل نوع توسيم، مخزنة في potato/ai/prompt/. يمكنك تخصيصها بتعديل ملفات الأوامر:

نوع التوسيمملف الأمر
أزرار الاختيارradio_prompt.txt
مقاييس ليكرتlikert_prompt.txt
خانات الاختيارcheckbox_prompt.txt
توسيم النطاقspan_prompt.txt
إدخال النصtext_prompt.txt

تدعم الأوامر استبدال المتغيرات بـ {text} و {labels} و {description}.

نصائح للتوسيم المدعوم بالذكاء الاصطناعي

  1. ابدأ بحذر: راجع جميع الاقتراحات في البداية
  2. راقب معدلات القبول: معدلات منخفضة تشير إلى مشاكل في الأوامر
  3. حسّن الأوامر بشكل متكرر: صقلها بناءً على الأخطاء الشائعة
  4. حافظ على الإشراف البشري: الذكاء الاصطناعي يساعد والبشر يقررون
  5. تتبع تسميات الذكاء الاصطناعي مقابل البشر: قِس دقة الذكاء الاصطناعي بمرور الوقت

جديد في الإصدار 2.2: تمييز الخيارات

يضيف Potato 2.2 ميزة جديدة للذكاء الاصطناعي تسمى تمييز الخيارات تحلل المحتوى لتمييز الخيارات الأكثر احتمالاً للصواب لمهام التوسيم المنفصلة (radio، multiselect، likert). يتم تمييز أعلى k خيارات بمؤشر نجمة بينما يتم تعتيم الخيارات الأقل احتمالاً، مع إبقاء جميع الخيارات قابلة للنقر بالكامل.

yaml
ai_support:
  option_highlighting:
    enabled: true
    top_k: 3
    dim_opacity: 0.4

اقرأ وثائق تمييز الخيارات الكاملة ←

الخطوات التالية


وثائق الذكاء الاصطناعي الكاملة في /docs/features/ai-support.