دمج نماذج اللغة الكبيرة لتلميحات التوسيم الذكية
تعلم كيفية استخدام OpenAI أو Claude أو Gemini لتقديم تلميحات واقتراحات ذكية للمُوسِّمين.
دمج نماذج اللغة الكبيرة لتلميحات التوسيم الذكية
يمكن للتوسيم المدعوم بالذكاء الاصطناعي تحسين كل من السرعة والجودة بشكل كبير. يغطي هذا الدليل دمج OpenAI و Claude و Gemini والنماذج المحلية لتقديم اقتراحات ذكية للمُوسِّمين.
ما يتيحه دمج نماذج اللغة الكبيرة
- اقتراحات التوسيم المسبق: الذكاء الاصطناعي يقدم تسميات أولية للمراجعة
- تمييز الكلمات المفتاحية: تمييز المصطلحات ذات الصلة تلقائياً
- تلميحات الجودة: الإشارة إلى أخطاء التوسيم المحتملة
- توليد التوضيحات: مساعدة المُوسِّمين على فهم الحالات الصعبة
تكامل OpenAI الأساسي
annotation_task_name: "AI-Assisted Sentiment Analysis"
# AI configuration
ai_support:
enabled: true
endpoint_type: openai
ai_config:
model: gpt-4
api_key: ${OPENAI_API_KEY}
temperature: 0.3
max_tokens: 500
features:
hints:
enabled: true
keyword_highlighting:
enabled: true
label_suggestions:
enabled: true
# ... rest of config
annotation_schemes:
- annotation_type: radio
name: sentiment
labels: [Positive, Negative, Neutral]المزودون المدعومون
OpenAI
ai_support:
enabled: true
endpoint_type: openai
ai_config:
model: gpt-4 # or gpt-4o, gpt-3.5-turbo
api_key: ${OPENAI_API_KEY}
temperature: 0.3
max_tokens: 500Anthropic Claude
ai_support:
enabled: true
endpoint_type: anthropic
ai_config:
model: claude-3-sonnet-20240229
api_key: ${ANTHROPIC_API_KEY}
temperature: 0.3
max_tokens: 500Google Gemini
ai_support:
enabled: true
endpoint_type: google
ai_config:
model: gemini-1.5-pro
api_key: ${GOOGLE_API_KEY}النماذج المحلية (Ollama)
ai_support:
enabled: true
endpoint_type: ollama
ai_config:
model: llama2 # or mistral, mixtral, etc.
base_url: http://localhost:11434الميزة: اقتراحات التسميات
يمكن لنماذج الذكاء الاصطناعي اقتراح تسميات لنظر المُوسِّم:
ai_support:
enabled: true
endpoint_type: openai
ai_config:
model: gpt-4
api_key: ${OPENAI_API_KEY}
features:
label_suggestions:
enabled: true
show_confidence: true
annotation_schemes:
- annotation_type: radio
name: category
labels: [News, Opinion, Satire, Other]الميزة: تمييز الكلمات المفتاحية
تمييز المصطلحات المهمة تلقائياً:
ai_support:
enabled: true
endpoint_type: openai
ai_config:
model: gpt-4
api_key: ${OPENAI_API_KEY}
features:
keyword_highlighting:
enabled: trueالميزة: التلميحات الذكية
تقديم إرشاد سياقي للمُوسِّمين:
ai_support:
enabled: true
endpoint_type: openai
ai_config:
model: gpt-4
api_key: ${OPENAI_API_KEY}
features:
hints:
enabled: trueتظهر التلميحات كإرشاد سياقي دون الكشف عن الإجابة، مما يساعد المُوسِّمين على التفكير في الحالات الصعبة.
تكوين كامل مدعوم بالذكاء الاصطناعي
annotation_task_name: "AI-Assisted NER Annotation"
# AI Configuration
ai_support:
enabled: true
endpoint_type: openai
ai_config:
model: gpt-4
api_key: ${OPENAI_API_KEY}
temperature: 0.2
max_tokens: 500
features:
hints:
enabled: true
keyword_highlighting:
enabled: true
label_suggestions:
enabled: true
show_confidence: true
cache_config:
disk_cache:
enabled: true
path: "ai_cache/cache.json"
prefetch:
warm_up_page_count: 50
on_next: 5
on_prev: 2
data_files:
- data/texts.json
item_properties:
id_key: id
text_key: content
annotation_schemes:
- annotation_type: span
name: entities
description: "Label named entities (AI suggestions provided)"
labels:
- name: PERSON
color: "#FF6B6B"
- name: ORG
color: "#4ECDC4"
- name: LOC
color: "#45B7D1"
- name: DATE
color: "#96CEB4"
output_annotation_dir: "annotation_output/"
output_annotation_format: "json"العمل مع اقتراحات الذكاء الاصطناعي
عندما يكون دعم الذكاء الاصطناعي مفعلاً، يرى المُوسِّمون الاقتراحات بجانب واجهة التوسيم. يمكنهم قبول أو تعديل أو تجاهل توصيات الذكاء الاصطناعي. التوسيم النهائي يعكس دائماً قرار المُوسِّم، مما يضمن الإشراف البشري.
يتم تخزين استجابات الذكاء الاصطناعي مؤقتاً تلقائياً عند تفعيل التخزين المؤقت، بحيث لا تؤدي نفس العينة إلى استدعاءات API متعددة.
الأوامر المخصصة
يتضمن Potato أوامر افتراضية لكل نوع توسيم، مخزنة في potato/ai/prompt/. يمكنك تخصيصها بتعديل ملفات الأوامر:
| نوع التوسيم | ملف الأمر |
|---|---|
| أزرار الاختيار | radio_prompt.txt |
| مقاييس ليكرت | likert_prompt.txt |
| خانات الاختيار | checkbox_prompt.txt |
| توسيم النطاق | span_prompt.txt |
| إدخال النص | text_prompt.txt |
تدعم الأوامر استبدال المتغيرات بـ {text} و {labels} و {description}.
نصائح للتوسيم المدعوم بالذكاء الاصطناعي
- ابدأ بحذر: راجع جميع الاقتراحات في البداية
- راقب معدلات القبول: معدلات منخفضة تشير إلى مشاكل في الأوامر
- حسّن الأوامر بشكل متكرر: صقلها بناءً على الأخطاء الشائعة
- حافظ على الإشراف البشري: الذكاء الاصطناعي يساعد والبشر يقررون
- تتبع تسميات الذكاء الاصطناعي مقابل البشر: قِس دقة الذكاء الاصطناعي بمرور الوقت
جديد في الإصدار 2.2: تمييز الخيارات
يضيف Potato 2.2 ميزة جديدة للذكاء الاصطناعي تسمى تمييز الخيارات تحلل المحتوى لتمييز الخيارات الأكثر احتمالاً للصواب لمهام التوسيم المنفصلة (radio، multiselect، likert). يتم تمييز أعلى k خيارات بمؤشر نجمة بينما يتم تعتيم الخيارات الأقل احتمالاً، مع إبقاء جميع الخيارات قابلة للنقر بالكامل.
ai_support:
option_highlighting:
enabled: true
top_k: 3
dim_opacity: 0.4اقرأ وثائق تمييز الخيارات الكاملة ←
الخطوات التالية
- فعّل التعلم النشط لإعطاء الأولوية للعناصر غير المؤكدة
- أعدّ ضبط الجودة مع مقاييس الذكاء الاصطناعي
- تعرف على النماذج المحلية للخصوصية
- استكشف تمييز الخيارات للتوسيم الموجه
وثائق الذكاء الاصطناعي الكاملة في /docs/features/ai-support.