التقييم المتعدد (تقييم مصفوفي)

تقييم عناصر متعددة على نفس المقياس بتنسيق مصفوفي.

يعرض نوع التقييم المتعدد عناصر متعددة بتنسيق مصفوفي حيث يتم تقييم كل عنصر على نفس المقياس. مثالي لتقييم أبعاد متعددة لعنصر واحد.

الإعداد الأساسي

yaml

annotation_schemes:
  - name: "aspect_ratings"
    description: "Rate each aspect of the response"
    annotation_type: "multirate"
    labels:
      - name: "Accuracy"
      - name: "Clarity"
      - name: "Helpfulness"
    options:
      - name: "1"
      - name: "2"
      - name: "3"
      - name: "4"
      - name: "5"

خيارات الإعدادات

الحقل	النوع	مطلوب	الوصف
`name`	string	نعم	معرّف فريد للتوسيم
`description`	string	نعم	التعليمات المعروضة للموسِّمين
`annotation_type`	string	نعم	يجب أن يكون `"multirate"`
`labels`	array	نعم	العناصر المراد تقييمها (الصفوف)
`options`	array	نعم	خيارات مقياس التقييم (الأعمدة)
`size`	number	لا	بديل عن options: عدد نقاط المقياس
`min_label`	string	لا	تسمية أدنى تقييم
`max_label`	string	لا	تسمية أعلى تقييم
`randomize`	boolean	لا	عشوائية ترتيب العناصر
`compact`	boolean	لا	استخدام تخطيط مضغوط

أمثلة

تقييم جودة الاستجابة

yaml

- name: "quality_assessment"
  description: "Rate each aspect of the AI response"
  annotation_type: "multirate"
  labels:
    - name: "Accuracy"
      tooltip: "Is the information factually correct?"
    - name: "Completeness"
      tooltip: "Does it fully address the question?"
    - name: "Clarity"
      tooltip: "Is it easy to understand?"
    - name: "Relevance"
      tooltip: "Does it stay on topic?"
  size: 5
  min_label: "Poor"
  max_label: "Excellent"

جودة الترجمة

yaml

- name: "translation_quality"
  description: "Evaluate the translation quality"
  annotation_type: "multirate"
  labels:
    - name: "Fluency"
    - name: "Adequacy"
    - name: "Terminology"
    - name: "Style"
  options:
    - name: "1 - Unacceptable"
    - name: "2 - Poor"
    - name: "3 - Acceptable"
    - name: "4 - Good"
    - name: "5 - Excellent"

أبعاد مراجعة المنتج

yaml

- name: "product_dimensions"
  description: "Rate each aspect of the product"
  annotation_type: "multirate"
  labels:
    - name: "Build Quality"
    - name: "Value for Money"
    - name: "Ease of Use"
    - name: "Customer Support"
    - name: "Documentation"
  size: 5
  min_label: "Very Poor"
  max_label: "Excellent"
  randomize: true

صيغة المخرجات

ينتج توسيم التقييم المتعدد قاموسًا يربط كل عنصر بتقييمه:

json

{
  "id": "item_1",
  "annotations": {
    "aspect_ratings": {
      "Accuracy": "4",
      "Clarity": "5",
      "Helpfulness": "3"
    }
  }
}

حالات الاستخدام

تقييم نماذج اللغة الكبيرة: تقييم الاستجابات على أبعاد جودة متعددة
تقييم الترجمة: تقييم الطلاقة والكفاية والمصطلحات
مراجعات المنتجات: جمع التقييمات عبر جوانب المنتج المختلفة
البحث الاستقصائي: أسئلة مصفوفية بأسلوب ليكرت
المراجعة بين الأقران: تقييم الأوراق على معايير متعددة

أفضل الممارسات

حدد عدد العناصر - 3-7 عناصر تعمل بشكل أفضل؛ أكثر من ذلك يسبب إرهاقًا
استخدم مقاييس متسقة - يجب أن تستخدم جميع العناصر نفس مقياس التقييم
رتّب العناصر منطقيًا - جمّع الأبعاد المرتبطة معًا
قدّم تعريفات واضحة - استخدم التلميحات لشرح كل بُعد
فكّر في العشوائية - تمنع التحيز الترتيبي في الاستجابات