سلاسل الإشارة المرجعية المشتركة
تجميع نطاقات النص التي تشير إلى نفس الكيان لمهام حل الإشارة المرجعية.
سلاسل الإشارة المرجعية المشتركة
يتيح توسيم الإشارة المرجعية المشتركة للموسِّمين تجميع نطاقات النص التي تشير إلى نفس الكيان. هذا ضروري لحل الكيانات، وحل الضمائر، وتحليل الخطاب.
نظرة عامة
سلسلة الإشارة المرجعية المشتركة هي مجموعة من الإشارات (نطاقات النص) التي تشير جميعها إلى نفس الكيان في العالم الحقيقي. على سبيل المثال:
"Marie Curie was a physicist. She won the Nobel Prize. The scientist changed her field forever."
النطاقات "Marie Curie" و"She" و"The scientist" و"her" تشير جميعها إلى نفس الشخص وتشكل سلسلة إشارة مرجعية واحدة.
البدء السريع
يتطلب توسيم الإشارة المرجعية المشتركة مكونين من المخططات:
- مخطط نطاقات لإنشاء الإشارات
- مخطط إشارة مرجعية لتجميع الإشارات في سلاسل
annotation_schemes:
- annotation_type: span
name: mentions
description: Highlight all entity mentions
labels:
- name: MENTION
tooltip: "Any reference to an entity"
sequential_key_binding: true
- annotation_type: coreference
name: coref_chains
description: Group mentions that refer to the same entity
span_schema: mentions
allow_singletons: trueخيارات الإعدادات
| الحقل | النوع | الافتراضي | الوصف |
|---|---|---|---|
annotation_type | string | مطلوب | يجب أن يكون "coreference" |
name | string | مطلوب | معرّف فريد لهذا المخطط |
description | string | مطلوب | التعليمات المعروضة للموسِّمين |
span_schema | string | مطلوب | اسم مخطط النطاقات الذي يوفر الإشارات |
entity_types | list | [] | قائمة فئات أنواع الكيانات |
allow_singletons | boolean | true | السماح بسلاسل تحتوي على إشارة واحدة فقط |
visual_display.highlight_mode | string | "background" | النمط المرئي: "background" أو "bracket" أو "underline" |
أمثلة
مع أنواع الكيانات
تصنيف السلاسل حسب نوع الكيان:
annotation_schemes:
- annotation_type: span
name: ner
description: Mark named entities
labels:
- name: ENTITY
tooltip: "Any named entity mention"
- annotation_type: coreference
name: coref
description: Create coreference chains
span_schema: ner
entity_types:
- name: PERSON
color: "#6E56CF"
- name: ORGANIZATION
color: "#22C55E"
- name: LOCATION
color: "#3B82F6"
- name: OTHER
color: "#F59E0B"بدون إشارات مفردة
للمهام التي يجب أن ترتبط فيها كل إشارة بإشارة واحدة على الأقل:
annotation_schemes:
- annotation_type: span
name: mentions
description: Highlight co-referring mentions
labels:
- name: MENTION
- annotation_type: coreference
name: strict_coref
description: All mentions must be part of a chain with at least 2 mentions
span_schema: mentions
allow_singletons: falseعرض مرئي مخصص
annotation_schemes:
- annotation_type: coreference
name: coref
description: Link coreference chains
span_schema: mentions
visual_display:
highlight_mode: "underline" # Options: background, bracket, underlineواجهة المستخدم
إنشاء السلاسل
- إنشاء الإشارات: استخدم أداة توسيم النطاقات لتمييز جميع إشارات الكيانات
- اختيار الإشارات: انقر على النطاقات المميزة التي تريد ربطها معًا
- إنشاء سلسلة: انقر على "سلسلة جديدة" لتجميع الإشارات المحددة
إدارة السلاسل
- إضافة إلى السلسلة: اختر إشارات إضافية وانقر على "إضافة إلى السلسلة"
- دمج السلاسل: اختر سلاسل متعددة وانقر على "دمج السلاسل" لجمعها
- إزالة إشارة: اختر إشارة وانقر على "إزالة الإشارة" لإزالتها من سلسلتها
الترميز اللوني
يتم تعيين لون مميز لكل سلسلة تلقائيًا. تشترك الإشارات في نفس السلسلة في نفس اللون، مما يسهل تحديد عضوية السلسلة بصريًا.
صيغة المخرجات
يتم حفظ توسيمات الإشارة المرجعية المشتركة كروابط نطاقات:
{
"span_links": [
{
"schema": "coref_chains",
"link_type": "coreference",
"span_ids": ["mentions_0_5_MENTION", "mentions_34_37_MENTION", "mentions_72_85_MENTION"],
"entity_type": "PERSON"
},
{
"schema": "coref_chains",
"link_type": "coreference",
"span_ids": ["mentions_15_23_MENTION", "mentions_95_97_MENTION"],
"entity_type": "ORGANIZATION"
}
]
}سير العمل الموصى به
- المرور الأول - اقرأ النص وميّز جميع إشارات الكيانات
- المرور الثاني - جمّع الإشارات في سلاسل إشارة مرجعية مشتركة
- المراجعة - تحقق من أن جميع الإشارات معينة بشكل صحيح ولا توجد سلاسل مفقودة
أفضل الممارسات
- حدد حدود الإشارة بوضوح - ضع إرشادات لما يُعتبر إشارة
- تعامل مع الإشارات المتداخلة - قرر كيفية التعامل مع حالات مثل "الرئيس التنفيذي لشركة Microsoft"
- اعتبر الإشارات العامة - حدد ما إذا كانت الإشارات العامة يجب أن تُضمن
- درّب الموسِّمين - الإشارة المرجعية المشتركة معقدة؛ قدّم أمثلة وجولات تدريبية
- استخدم أنواع الكيانات باعتدال - الكثير منها يبطئ التوسيم دون تحسين جودة البيانات
قراءة إضافية
- توسيم النطاقات - إنشاء نطاقات النص
- ربط الكيانات - ربط النطاقات بقواعد المعرفة
- ربط النطاقات - أنواع أخرى من علاقات النطاقات
لمزيد من التفاصيل التقنية، راجع الوثائق المصدرية.