مرحلة التدريب
تدريب المعلّقين وتأهيلهم بأسئلة تدريبية قبل المهمة الرئيسية.
مرحلة التدريب
يتضمن Potato 2.0 مرحلة تدريب اختيارية تساعد في تأهيل المعلّقين قبل أن يبدأوا مهمة التعليق التوضيحي الرئيسية. يجيب المعلّقون على أسئلة تدريبية ذات إجابات صحيحة معروفة ويتلقون تغذية راجعة حول أدائهم.
حالات الاستخدام
- التأكد من فهم المعلّقين للمهمة
- تصفية المعلّقين ذوي الجودة المنخفضة
- توفير تدريب عملي موجّه قبل التعليقات التوضيحية الحقيقية
- جمع مقاييس جودة أساسية
- تعليم إرشادات التعليق التوضيحي من خلال الأمثلة
كيف يعمل
- يكمل المعلّقون مجموعة من أسئلة التدريب
- يتلقون تغذية راجعة فورية على كل إجابة
- يُتتبع التقدم مقابل معايير النجاح
- فقط المعلّقون الذين ينجحون يمكنهم المتابعة إلى المهمة الرئيسية
التهيئة
الإعداد الأساسي
phases:
training:
enabled: true
data_file: "data/training_data.json"
schema_name: sentiment # Which annotation scheme to train
# Passing criteria
passing_criteria:
min_correct: 8 # Must get at least 8 correct
total_questions: 10التهيئة الكاملة
phases:
training:
enabled: true
data_file: "data/training_data.json"
schema_name: sentiment
passing_criteria:
# Different criteria options (choose one or combine)
min_correct: 8
require_all_correct: false
max_mistakes: 3
max_mistakes_per_question: 2
# Allow retries
retries:
enabled: true
max_retries: 3
# Show explanations for incorrect answers
show_explanations: true
# Randomize question order
randomize: trueمعايير النجاح
يمكنك تحديد معايير مختلفة للنجاح في مرحلة التدريب:
الحد الأدنى من الإجابات الصحيحة
passing_criteria:
min_correct: 8
total_questions: 10يجب أن يجيب المعلّق على 8 من أصل 10 أسئلة بشكل صحيح على الأقل.
إجابة صحيحة لجميع الأسئلة
passing_criteria:
require_all_correct: trueيجب أن يجيب المعلّق على كل سؤال بشكل صحيح للنجاح.
الحد الأقصى من الأخطاء
passing_criteria:
max_mistakes: 3يُستبعد المعلّق بعد 3 أخطاء إجمالية.
الحد الأقصى من الأخطاء لكل سؤال
passing_criteria:
max_mistakes_per_question: 2يُستبعد المعلّق بعد خطأين في أي سؤال واحد.
معايير مجمّعة
passing_criteria:
min_correct: 8
max_mistakes_per_question: 3يجب الإجابة على 8 أسئلة بشكل صحيح وعدم الفشل في أي سؤال أكثر من 3 مرات.
تنسيق بيانات التدريب
يجب أن تتضمن بيانات التدريب الإجابات الصحيحة والتفسيرات الاختيارية:
[
{
"id": "train_1",
"text": "I absolutely love this product! Best purchase ever!",
"correct_answers": {
"sentiment": "Positive"
},
"explanation": "This text expresses strong positive sentiment with words like 'love' and 'best'."
},
{
"id": "train_2",
"text": "This is the worst service I've ever experienced.",
"correct_answers": {
"sentiment": "Negative"
},
"explanation": "The words 'worst' and the overall complaint indicate negative sentiment."
},
{
"id": "train_3",
"text": "The package arrived on time.",
"correct_answers": {
"sentiment": "Neutral"
},
"explanation": "This is a factual statement without emotional indicators."
}
]التدريب على مخططات متعددة
للمهام التي تحتوي على مخططات تعليق توضيحي متعددة:
{
"id": "train_1",
"text": "Apple announced new iPhone features yesterday.",
"correct_answers": {
"sentiment": "Neutral",
"topic": "Technology"
},
"explanation": {
"sentiment": "This is a factual news statement.",
"topic": "The text discusses Apple and iPhone, which are tech topics."
}
}تجربة المستخدم
تدفق التدريب
- يرى المستخدم مؤشر "مرحلة التدريب"
- يُعرض السؤال مع نموذج التعليق التوضيحي
- يقدم المستخدم إجابته
- تُعرض التغذية الراجعة فوراً:
- صحيح: علامة خضراء، الانتقال إلى التالي
- خطأ: علامة X حمراء، عرض التفسير، خيار إعادة المحاولة
عرض التغذية الراجعة
عندما يجيب المعلّق بشكل خاطئ:
- تُبرز الإجابة الصحيحة
- يُعرض التفسير المقدم
- يظهر زر إعادة المحاولة (إذا كانت إعادة المحاولة مفعّلة)
- يُعرض التقدم نحو معايير النجاح
مراقبة المشرف
تتبع أداء التدريب في لوحة تحكم المشرف:
- معدلات الإكمال
- متوسط الإجابات الصحيحة
- معدلات النجاح/الفشل
- الوقت المستغرق في التدريب
- الدقة لكل سؤال
الوصول عبر نقاط نهاية /admin:
GET /api/admin/training/stats
GET /api/admin/training/user/{user_id}
مثال: تدريب تحليل المشاعر
task_name: "Sentiment Analysis"
task_dir: "."
port: 8000
# Main annotation data
data_files:
- "data/reviews.json"
item_properties:
id_key: id
text_key: text
annotation_schemes:
- annotation_type: radio
name: sentiment
description: "What is the sentiment of this review?"
labels:
- Positive
- Negative
- Neutral
# Training phase configuration
phases:
training:
enabled: true
data_file: "data/training_questions.json"
schema_name: sentiment
passing_criteria:
min_correct: 8
total_questions: 10
max_mistakes_per_question: 2
retries:
enabled: true
max_retries: 3
show_explanations: true
randomize: true
output_annotation_dir: "output/"
output_annotation_format: "json"
allow_all_users: trueمثال: تدريب التعرف على الكيانات المسماة
annotation_schemes:
- annotation_type: span
name: entities
description: "Highlight named entities"
labels:
- Person
- Organization
- Location
- Date
phases:
training:
enabled: true
data_file: "data/ner_training.json"
schema_name: entities
passing_criteria:
min_correct: 7
total_questions: 10
show_explanations: trueبيانات التدريب للتعليق التوضيحي على النطاقات:
{
"id": "train_1",
"text": "Tim Cook announced that Apple will open a new store in New York on March 15.",
"correct_answers": {
"entities": [
{"start": 0, "end": 8, "label": "Person"},
{"start": 24, "end": 29, "label": "Organization"},
{"start": 54, "end": 62, "label": "Location"},
{"start": 66, "end": 74, "label": "Date"}
]
},
"explanation": "Tim Cook is a Person, Apple is an Organization, New York is a Location, and March 15 is a Date."
}أفضل الممارسات
1. ابدأ ببساطة
ابدأ بأمثلة مباشرة قبل تقديم الحالات الحدّية:
[
{"text": "I love this!", "correct_answers": {"sentiment": "Positive"}},
{"text": "I hate this!", "correct_answers": {"sentiment": "Negative"}},
{"text": "It arrived yesterday.", "correct_answers": {"sentiment": "Neutral"}}
]2. غطِّ جميع التسميات
تأكد من أن التدريب يتضمن أمثلة لكل تسمية ممكنة:
[
{"correct_answers": {"sentiment": "Positive"}},
{"correct_answers": {"sentiment": "Negative"}},
{"correct_answers": {"sentiment": "Neutral"}}
]3. اكتب تفسيرات واضحة
يجب أن تعلّم التفسيرات إرشادات التعليق التوضيحي:
{
"explanation": "While this text mentions a problem, the overall tone is constructive and the reviewer expresses satisfaction with the resolution. This makes it Positive rather than Negative."
}4. حدد معايير معقولة
لا تشترط الكمال دون ضرورة:
# Too strict - may lose good annotators
passing_criteria:
require_all_correct: true
# Better - allows for learning
passing_criteria:
min_correct: 8
total_questions: 105. أدرج الحالات الحدّية
أضف أمثلة صعبة لإعداد المعلّقين:
{
"text": "Not bad at all, I guess it could be worse.",
"correct_answers": {"sentiment": "Neutral"},
"explanation": "Despite negative words like 'not bad' and 'worse', this is actually a lukewarm endorsement - neutral rather than positive or negative."
}التكامل مع سير العمل
يتكامل التدريب مع سير العمل متعدد المراحل:
phases:
consent:
enabled: true
data_file: "data/consent.json"
prestudy:
enabled: true
data_file: "data/demographics.json"
instructions:
enabled: true
content: "data/instructions.html"
training:
enabled: true
data_file: "data/training.json"
schema_name: sentiment
passing_criteria:
min_correct: 8
annotation:
# Main task - always enabled
enabled: true
poststudy:
enabled: true
data_file: "data/feedback.json"اعتبارات الأداء
- تُحمّل بيانات التدريب عند بدء التشغيل
- يُخزّن التقدم في الذاكرة لكل جلسة
- تأثير ضئيل على أداء التعليق التوضيحي الرئيسي
- فكّر في فصل التدريب المعقد إلى مراحل متعددة
قراءات إضافية
- مراقبة الجودة - فحوصات الانتباه والمعايير الذهبية
- تعيين الفئات - توجيه العناصر حسب خبرة المعلّق
- سير العمل متعدد المراحل - سير عمل التعليق التوضيحي المعقد
للاطلاع على تفاصيل التنفيذ، راجع الوثائق المصدرية.