Skip to content

التقييم المتعدد (تقييم مصفوفي)

تقييم عناصر متعددة على نفس المقياس بتنسيق مصفوفي.

توسيم التقييم المتعدد (المصفوفي)

يعرض نوع التقييم المتعدد عناصر متعددة بتنسيق مصفوفي حيث يتم تقييم كل عنصر على نفس المقياس. مثالي لتقييم أبعاد متعددة لعنصر واحد.

الإعداد الأساسي

yaml
annotation_schemes:
  - name: "aspect_ratings"
    description: "Rate each aspect of the response"
    annotation_type: "multirate"
    labels:
      - name: "Accuracy"
      - name: "Clarity"
      - name: "Helpfulness"
    options:
      - name: "1"
      - name: "2"
      - name: "3"
      - name: "4"
      - name: "5"

خيارات الإعدادات

الحقلالنوعمطلوبالوصف
namestringنعممعرّف فريد للتوسيم
descriptionstringنعمالتعليمات المعروضة للموسِّمين
annotation_typestringنعميجب أن يكون "multirate"
labelsarrayنعمالعناصر المراد تقييمها (الصفوف)
optionsarrayنعمخيارات مقياس التقييم (الأعمدة)
sizenumberلابديل عن options: عدد نقاط المقياس
min_labelstringلاتسمية أدنى تقييم
max_labelstringلاتسمية أعلى تقييم
randomizebooleanلاعشوائية ترتيب العناصر
compactbooleanلااستخدام تخطيط مضغوط

أمثلة

تقييم جودة الاستجابة

yaml
- name: "quality_assessment"
  description: "Rate each aspect of the AI response"
  annotation_type: "multirate"
  labels:
    - name: "Accuracy"
      tooltip: "Is the information factually correct?"
    - name: "Completeness"
      tooltip: "Does it fully address the question?"
    - name: "Clarity"
      tooltip: "Is it easy to understand?"
    - name: "Relevance"
      tooltip: "Does it stay on topic?"
  size: 5
  min_label: "Poor"
  max_label: "Excellent"

جودة الترجمة

yaml
- name: "translation_quality"
  description: "Evaluate the translation quality"
  annotation_type: "multirate"
  labels:
    - name: "Fluency"
    - name: "Adequacy"
    - name: "Terminology"
    - name: "Style"
  options:
    - name: "1 - Unacceptable"
    - name: "2 - Poor"
    - name: "3 - Acceptable"
    - name: "4 - Good"
    - name: "5 - Excellent"

أبعاد مراجعة المنتج

yaml
- name: "product_dimensions"
  description: "Rate each aspect of the product"
  annotation_type: "multirate"
  labels:
    - name: "Build Quality"
    - name: "Value for Money"
    - name: "Ease of Use"
    - name: "Customer Support"
    - name: "Documentation"
  size: 5
  min_label: "Very Poor"
  max_label: "Excellent"
  randomize: true

صيغة المخرجات

ينتج توسيم التقييم المتعدد قاموسًا يربط كل عنصر بتقييمه:

json
{
  "id": "item_1",
  "annotations": {
    "aspect_ratings": {
      "Accuracy": "4",
      "Clarity": "5",
      "Helpfulness": "3"
    }
  }
}

حالات الاستخدام

  • تقييم نماذج اللغة الكبيرة: تقييم الاستجابات على أبعاد جودة متعددة
  • تقييم الترجمة: تقييم الطلاقة والكفاية والمصطلحات
  • مراجعات المنتجات: جمع التقييمات عبر جوانب المنتج المختلفة
  • البحث الاستقصائي: أسئلة مصفوفية بأسلوب ليكرت
  • المراجعة بين الأقران: تقييم الأوراق على معايير متعددة

أفضل الممارسات

  1. حدد عدد العناصر - 3-7 عناصر تعمل بشكل أفضل؛ أكثر من ذلك يسبب إرهاقًا
  2. استخدم مقاييس متسقة - يجب أن تستخدم جميع العناصر نفس مقياس التقييم
  3. رتّب العناصر منطقيًا - جمّع الأبعاد المرتبطة معًا
  4. قدّم تعريفات واضحة - استخدم التلميحات لشرح كل بُعد
  5. فكّر في العشوائية - تمنع التحيز الترتيبي في الاستجابات