Skip to content

سلاسل الإشارة المرجعية المشتركة

تجميع نطاقات النص التي تشير إلى نفس الكيان لمهام حل الإشارة المرجعية.

سلاسل الإشارة المرجعية المشتركة

يتيح توسيم الإشارة المرجعية المشتركة للموسِّمين تجميع نطاقات النص التي تشير إلى نفس الكيان. هذا ضروري لحل الكيانات، وحل الضمائر، وتحليل الخطاب.

نظرة عامة

سلسلة الإشارة المرجعية المشتركة هي مجموعة من الإشارات (نطاقات النص) التي تشير جميعها إلى نفس الكيان في العالم الحقيقي. على سبيل المثال:

"Marie Curie was a physicist. She won the Nobel Prize. The scientist changed her field forever."

النطاقات "Marie Curie" و"She" و"The scientist" و"her" تشير جميعها إلى نفس الشخص وتشكل سلسلة إشارة مرجعية واحدة.

البدء السريع

يتطلب توسيم الإشارة المرجعية المشتركة مكونين من المخططات:

  1. مخطط نطاقات لإنشاء الإشارات
  2. مخطط إشارة مرجعية لتجميع الإشارات في سلاسل
yaml
annotation_schemes:
  - annotation_type: span
    name: mentions
    description: Highlight all entity mentions
    labels:
      - name: MENTION
        tooltip: "Any reference to an entity"
    sequential_key_binding: true
 
  - annotation_type: coreference
    name: coref_chains
    description: Group mentions that refer to the same entity
    span_schema: mentions
    allow_singletons: true

خيارات الإعدادات

الحقلالنوعالافتراضيالوصف
annotation_typestringمطلوبيجب أن يكون "coreference"
namestringمطلوبمعرّف فريد لهذا المخطط
descriptionstringمطلوبالتعليمات المعروضة للموسِّمين
span_schemastringمطلوباسم مخطط النطاقات الذي يوفر الإشارات
entity_typeslist[]قائمة فئات أنواع الكيانات
allow_singletonsbooleantrueالسماح بسلاسل تحتوي على إشارة واحدة فقط
visual_display.highlight_modestring"background"النمط المرئي: "background" أو "bracket" أو "underline"

أمثلة

مع أنواع الكيانات

تصنيف السلاسل حسب نوع الكيان:

yaml
annotation_schemes:
  - annotation_type: span
    name: ner
    description: Mark named entities
    labels:
      - name: ENTITY
        tooltip: "Any named entity mention"
 
  - annotation_type: coreference
    name: coref
    description: Create coreference chains
    span_schema: ner
    entity_types:
      - name: PERSON
        color: "#6E56CF"
      - name: ORGANIZATION
        color: "#22C55E"
      - name: LOCATION
        color: "#3B82F6"
      - name: OTHER
        color: "#F59E0B"

بدون إشارات مفردة

للمهام التي يجب أن ترتبط فيها كل إشارة بإشارة واحدة على الأقل:

yaml
annotation_schemes:
  - annotation_type: span
    name: mentions
    description: Highlight co-referring mentions
    labels:
      - name: MENTION
 
  - annotation_type: coreference
    name: strict_coref
    description: All mentions must be part of a chain with at least 2 mentions
    span_schema: mentions
    allow_singletons: false

عرض مرئي مخصص

yaml
annotation_schemes:
  - annotation_type: coreference
    name: coref
    description: Link coreference chains
    span_schema: mentions
    visual_display:
      highlight_mode: "underline"  # Options: background, bracket, underline

واجهة المستخدم

إنشاء السلاسل

  1. إنشاء الإشارات: استخدم أداة توسيم النطاقات لتمييز جميع إشارات الكيانات
  2. اختيار الإشارات: انقر على النطاقات المميزة التي تريد ربطها معًا
  3. إنشاء سلسلة: انقر على "سلسلة جديدة" لتجميع الإشارات المحددة

إدارة السلاسل

  • إضافة إلى السلسلة: اختر إشارات إضافية وانقر على "إضافة إلى السلسلة"
  • دمج السلاسل: اختر سلاسل متعددة وانقر على "دمج السلاسل" لجمعها
  • إزالة إشارة: اختر إشارة وانقر على "إزالة الإشارة" لإزالتها من سلسلتها

الترميز اللوني

يتم تعيين لون مميز لكل سلسلة تلقائيًا. تشترك الإشارات في نفس السلسلة في نفس اللون، مما يسهل تحديد عضوية السلسلة بصريًا.

صيغة المخرجات

يتم حفظ توسيمات الإشارة المرجعية المشتركة كروابط نطاقات:

json
{
  "span_links": [
    {
      "schema": "coref_chains",
      "link_type": "coreference",
      "span_ids": ["mentions_0_5_MENTION", "mentions_34_37_MENTION", "mentions_72_85_MENTION"],
      "entity_type": "PERSON"
    },
    {
      "schema": "coref_chains",
      "link_type": "coreference",
      "span_ids": ["mentions_15_23_MENTION", "mentions_95_97_MENTION"],
      "entity_type": "ORGANIZATION"
    }
  ]
}

سير العمل الموصى به

  1. المرور الأول - اقرأ النص وميّز جميع إشارات الكيانات
  2. المرور الثاني - جمّع الإشارات في سلاسل إشارة مرجعية مشتركة
  3. المراجعة - تحقق من أن جميع الإشارات معينة بشكل صحيح ولا توجد سلاسل مفقودة

أفضل الممارسات

  1. حدد حدود الإشارة بوضوح - ضع إرشادات لما يُعتبر إشارة
  2. تعامل مع الإشارات المتداخلة - قرر كيفية التعامل مع حالات مثل "الرئيس التنفيذي لشركة Microsoft"
  3. اعتبر الإشارات العامة - حدد ما إذا كانت الإشارات العامة يجب أن تُضمن
  4. درّب الموسِّمين - الإشارة المرجعية المشتركة معقدة؛ قدّم أمثلة وجولات تدريبية
  5. استخدم أنواع الكيانات باعتدال - الكثير منها يبطئ التوسيم دون تحسين جودة البيانات

قراءة إضافية

لمزيد من التفاصيل التقنية، راجع الوثائق المصدرية.