Tutorials4 min read
إنشاء مهمة تحليل المشاعر
ابنِ مهمة تصنيف مشاعر كاملة مع أزرار اختيار وتلميحات واختصارات لوحة مفاتيح للتوسيم الفعال.
Potato Team·
إنشاء مهمة تحليل المشاعر
تحليل المشاعر هو مهمة أساسية في معالجة اللغات الطبيعية، ويجعل Potato جمع تسميات مشاعر عالية الجودة أمراً سهلاً. في هذا الدرس، سنبني واجهة توصيف مشاعر جاهزة للإنتاج مع جميع المزايا.
نظرة عامة على المشروع
سننشئ واجهة لتوصيف منشورات وسائل التواصل الاجتماعي مع:
- تصنيف مشاعر ثلاثي (إيجابي، سلبي، محايد)
- تقييمات ثقة لكل توصيف
- تفسيرات نصية اختيارية
- اختصارات لوحة مفاتيح للسرعة
- تدابير مراقبة الجودة
الإعداد الكامل
إليك config.yaml الكامل:
yaml
annotation_task_name: "Social Media Sentiment Analysis"
# Data configuration
data_files:
- "data/tweets.json"
item_properties:
id_key: id
text_key: text
# Annotation interface
annotation_schemes:
# Primary sentiment label
- annotation_type: radio
name: sentiment
description: "What is the overall sentiment of this post?"
labels:
- name: Positive
tooltip: "Expresses happiness, satisfaction, or approval"
keyboard_shortcut: "1"
- name: Negative
tooltip: "Expresses sadness, frustration, or disapproval"
keyboard_shortcut: "2"
- name: Neutral
tooltip: "Factual, objective, or lacks emotional content"
keyboard_shortcut: "3"
required: true
# Confidence rating
- annotation_type: likert
name: confidence
description: "How confident are you in your sentiment label?"
size: 5
min_label: "Not confident"
max_label: "Very confident"
required: true
# Optional explanation
- annotation_type: text
name: explanation
description: "Why did you choose this label? (Optional)"
textarea: true
required: false
placeholder: "Explain your reasoning..."
# Guidelines
annotation_guidelines:
title: "Sentiment Annotation Guidelines"
content: |
## Your Task
Classify the sentiment expressed in each social media post.
## Labels
**Positive**: The author expresses positive emotions or opinions
- Happiness, excitement, gratitude
- Praise, recommendations, approval
- Examples: "Love this!", "Best day ever!", "Highly recommend"
**Negative**: The author expresses negative emotions or opinions
- Anger, frustration, sadness
- Complaints, criticism, disapproval
- Examples: "Terrible service", "So disappointed", "Worst experience"
**Neutral**: Factual or lacking clear sentiment
- News, announcements, questions
- Mixed or balanced opinions
- Examples: "The store opens at 9am", "Has anyone tried this?"
## Tips
- Focus on the author's sentiment, not the topic
- Sarcasm should be labeled based on intended meaning
- When unsure, lower your confidence rating
# User management
automatic_assignment:
on: true
sampling_strategy: random
labels_per_instance: 1
instance_per_annotator: 100تنسيق بيانات العيّنة
أنشئ data/tweets.json:
json
{"id": "t001", "text": "Just got my new laptop and I'm absolutely loving it! Best purchase of the year! #happy"}
{"id": "t002", "text": "Waited 2 hours for customer service and they still couldn't help me. Never shopping here again."}
{"id": "t003", "text": "The new coffee shop on Main Street opens tomorrow at 7am."}
{"id": "t004", "text": "This movie was okay I guess. Some good parts, some boring parts."}
{"id": "t005", "text": "Can't believe how beautiful the sunset was tonight! Nature is amazing."}تشغيل المهمة
شغّل خادم التوصيف:
bash
potato start config.yamlانتقل إلى http://localhost:8000 وسجّل الدخول لبدء التوصيف.
فهم الواجهة
منطقة التوصيف الرئيسية
تعرض الواجهة:
- النص المطلوب توصيفه (مع تمييز الروابط والإشارات والهاشتاغات)
- أزرار اختيار المشاعر مع تلميحات
- مقياس Likert للثقة
- مربع نص تفسير اختياري
سير عمل لوحة المفاتيح
لأقصى كفاءة:
- اقرأ النص
- اضغط
1أو2أو3للمشاعر - انقر على مستوى الثقة (أو استخدم الفأرة)
- اضغط
Enterللإرسال
تتبع التقدم
تعرض الواجهة:
- التقدم الحالي (مثل "15 / 100")
- الوقت المقدّر المتبقي
- إحصائيات الجلسة
تنسيق المخرجات
تُحفظ التوصيفات في annotations/username.jsonl:
json
{
"id": "t001",
"text": "Just got my new laptop and I'm absolutely loving it!...",
"annotations": {
"sentiment": "Positive",
"confidence": 5,
"explanation": "Clear expression of happiness with the purchase"
},
"annotator": "john_doe",
"timestamp": "2026-01-15T14:30:00Z"
}إضافة مراقبة الجودة
فحوصات الانتباه
أضف عناصر معيارية ذهبية للتحقق من انتباه المُوصِّف:
yaml
quality_control:
attention_checks:
enabled: true
frequency: 10 # Every 10th item
items:
- text: "I am extremely happy and satisfied! This is the best!"
expected:
sentiment: "Positive"
- text: "This is absolutely terrible and I hate it completely."
expected:
sentiment: "Negative"اتفاق المُوصِّفين
للمشاريع البحثية، فعّل التوصيفات المتعددة:
yaml
automatic_assignment:
on: true
sampling_strategy: random
labels_per_instance: 3 # Each item annotated by 3 people
instance_per_annotator: 50تحليل النتائج
صدّر وحلّل توصيفاتك:
python
import json
from collections import Counter
# Load annotations
annotations = []
with open('annotations/annotator1.jsonl') as f:
for line in f:
annotations.append(json.loads(line))
# Sentiment distribution
sentiments = Counter(a['annotations']['sentiment'] for a in annotations)
print(f"Sentiment distribution: {dict(sentiments)}")
# Average confidence
confidences = [a['annotations']['confidence'] for a in annotations]
print(f"Average confidence: {sum(confidences)/len(confidences):.2f}")الخطوات التالية
- أعدّ التعهيد الجماعي للتوصيف واسع النطاق
- أضف اقتراحات الذكاء الاصطناعي لتسريع التوسيم
- نفّذ التعلم النشط لتحديد أولويات الحالات الصعبة
استكشف المزيد من أنواع التوصيف في التوثيق.