التقييم المتعدد (تقييم مصفوفي)
تقييم عناصر متعددة على نفس المقياس بتنسيق مصفوفي.
توسيم التقييم المتعدد (المصفوفي)
يعرض نوع التقييم المتعدد عناصر متعددة بتنسيق مصفوفي حيث يتم تقييم كل عنصر على نفس المقياس. مثالي لتقييم أبعاد متعددة لعنصر واحد.
الإعداد الأساسي
yaml
annotation_schemes:
- name: "aspect_ratings"
description: "Rate each aspect of the response"
annotation_type: "multirate"
labels:
- name: "Accuracy"
- name: "Clarity"
- name: "Helpfulness"
options:
- name: "1"
- name: "2"
- name: "3"
- name: "4"
- name: "5"خيارات الإعدادات
| الحقل | النوع | مطلوب | الوصف |
|---|---|---|---|
name | string | نعم | معرّف فريد للتوسيم |
description | string | نعم | التعليمات المعروضة للموسِّمين |
annotation_type | string | نعم | يجب أن يكون "multirate" |
labels | array | نعم | العناصر المراد تقييمها (الصفوف) |
options | array | نعم | خيارات مقياس التقييم (الأعمدة) |
size | number | لا | بديل عن options: عدد نقاط المقياس |
min_label | string | لا | تسمية أدنى تقييم |
max_label | string | لا | تسمية أعلى تقييم |
randomize | boolean | لا | عشوائية ترتيب العناصر |
compact | boolean | لا | استخدام تخطيط مضغوط |
أمثلة
تقييم جودة الاستجابة
yaml
- name: "quality_assessment"
description: "Rate each aspect of the AI response"
annotation_type: "multirate"
labels:
- name: "Accuracy"
tooltip: "Is the information factually correct?"
- name: "Completeness"
tooltip: "Does it fully address the question?"
- name: "Clarity"
tooltip: "Is it easy to understand?"
- name: "Relevance"
tooltip: "Does it stay on topic?"
size: 5
min_label: "Poor"
max_label: "Excellent"جودة الترجمة
yaml
- name: "translation_quality"
description: "Evaluate the translation quality"
annotation_type: "multirate"
labels:
- name: "Fluency"
- name: "Adequacy"
- name: "Terminology"
- name: "Style"
options:
- name: "1 - Unacceptable"
- name: "2 - Poor"
- name: "3 - Acceptable"
- name: "4 - Good"
- name: "5 - Excellent"أبعاد مراجعة المنتج
yaml
- name: "product_dimensions"
description: "Rate each aspect of the product"
annotation_type: "multirate"
labels:
- name: "Build Quality"
- name: "Value for Money"
- name: "Ease of Use"
- name: "Customer Support"
- name: "Documentation"
size: 5
min_label: "Very Poor"
max_label: "Excellent"
randomize: trueصيغة المخرجات
ينتج توسيم التقييم المتعدد قاموسًا يربط كل عنصر بتقييمه:
json
{
"id": "item_1",
"annotations": {
"aspect_ratings": {
"Accuracy": "4",
"Clarity": "5",
"Helpfulness": "3"
}
}
}حالات الاستخدام
- تقييم نماذج اللغة الكبيرة: تقييم الاستجابات على أبعاد جودة متعددة
- تقييم الترجمة: تقييم الطلاقة والكفاية والمصطلحات
- مراجعات المنتجات: جمع التقييمات عبر جوانب المنتج المختلفة
- البحث الاستقصائي: أسئلة مصفوفية بأسلوب ليكرت
- المراجعة بين الأقران: تقييم الأوراق على معايير متعددة
أفضل الممارسات
- حدد عدد العناصر - 3-7 عناصر تعمل بشكل أفضل؛ أكثر من ذلك يسبب إرهاقًا
- استخدم مقاييس متسقة - يجب أن تستخدم جميع العناصر نفس مقياس التقييم
- رتّب العناصر منطقيًا - جمّع الأبعاد المرتبطة معًا
- قدّم تعريفات واضحة - استخدم التلميحات لشرح كل بُعد
- فكّر في العشوائية - تمنع التحيز الترتيبي في الاستجابات