ربط الكيانات
ربط توسيمات النطاقات بقواعد المعرفة الخارجية مثل Wikidata وUMLS أو APIs مخصصة.
ربط الكيانات
يتيح ربط الكيانات للموسِّمين ربط توسيمات النطاقات بقواعد المعرفة الخارجية مثل Wikidata أو UMLS. يُنشئ هذا روابط دلالية بين إشارات النص والكيانات المرجعية، وهو قيّم للتعرف على الكيانات المسماة، وتطبيع المفاهيم، وبناء رسوم المعرفة.
كيف يعمل
عندما يكون ربط الكيانات مفعلاً لمخطط توسيم نطاقات:
- يميّز الموسِّمون النص ويعينون تسمية (مثل "PERSON" أو "ORGANIZATION")
- يظهر رمز ربط على شريط التحكم في النطاق
- النقر على الرمز يفتح نافذة بحث للعثور على كيانات مطابقة في قاعدة المعرفة
- يتم تخزين معرّف الكيان المحدد مع توسيم النطاق
- تعرض النطاقات المرتبطة رمزًا ممتلئًا وتظهر تفاصيل الكيان عند التمرير
البدء السريع
فعّل ربط الكيانات بإضافة إعدادات entity_linking لمخطط نطاقات:
annotation_schemes:
- annotation_type: span
name: ner
description: Named Entity Recognition with KB linking
labels:
- name: PERSON
tooltip: "People's names"
- name: ORGANIZATION
tooltip: "Companies, agencies, institutions"
- name: LOCATION
tooltip: "Places, cities, countries"
entity_linking:
enabled: true
knowledge_bases:
- name: wikidata
type: wikidata
language: enخيارات الإعدادات
| الخيار | النوع | الافتراضي | الوصف |
|---|---|---|---|
enabled | boolean | false | تفعيل ربط الكيانات لهذا المخطط |
knowledge_bases | list | [] | قائمة إعدادات قواعد المعرفة |
auto_search | boolean | true | البحث تلقائيًا عند فتح النافذة |
required | boolean | false | طلب ربط الكيان قبل حفظ النطاق |
multi_select | boolean | false | السماح بالربط بكيانات متعددة |
إعدادات قاعدة المعرفة
| الخيار | النوع | الافتراضي | الوصف |
|---|---|---|---|
name | string | مطلوب | معرّف فريد لقاعدة المعرفة |
type | string | مطلوب | نوع قاعدة المعرفة: wikidata أو umls أو rest |
api_key | string | null | مفتاح API للخدمات المصادق عليها |
base_url | string | null | عنوان URL الأساسي لـ REST APIs |
language | string | "en" | رمز اللغة لنتائج البحث |
timeout | integer | 10 | مهلة الطلب بالثواني |
قواعد المعرفة المدعومة
Wikidata
قاعدة معرفة مفتوحة ومجانية تحتوي على أكثر من 100 مليون كيان. لا تتطلب مفتاح API.
entity_linking:
enabled: true
knowledge_bases:
- name: wikidata
type: wikidata
language: enتتميز بتسميات متعددة اللغات، وأسماء بديلة للكيانات (مثل "NYC" تجد "New York City")، وروابط لمقالات Wikipedia.
UMLS
مصطلحات طبية وبيولوجية شاملة. تتطلب مفتاح API مجاني من UTS.
entity_linking:
enabled: true
knowledge_bases:
- name: umls
type: umls
api_key: ${UMLS_API_KEY}تتضمن مفاهيم طبية، وأدوية، وأمراض، وإجراءات، وإشارات متبادلة لأكثر من 200 مفردات مصدرية (SNOMED CT، ICD-10، MeSH، RxNorm).
REST APIs مخصصة
اتصل بأي قاعدة معرفة عبر REST API:
entity_linking:
enabled: true
knowledge_bases:
- name: internal_kb
type: rest
base_url: https://api.example.com
api_key: optional_api_key
extra_params:
search_endpoint: /search
entity_endpoint: /entity/{entity_id}
search_query_param: q
results_path: data.results
entity_id_field: id
label_field: name
description_field: descriptionقواعد معرفة متعددة
أعدّ قواعد معرفة متعددة للسماح للموسِّمين باختيار المصدر الأنسب:
entity_linking:
enabled: true
knowledge_bases:
- name: wikidata
type: wikidata
language: en
- name: umls
type: umls
api_key: ${UMLS_API_KEY}
- name: company_entities
type: rest
base_url: https://internal.company.com/api/entitiesتتيح قائمة منسدلة في نافذة البحث للموسِّمين التبديل بين قواعد المعرفة المعدة.
وضع الاختيار المتعدد
فعّل الاختيار المتعدد للسماح بربط نطاق بكيانات متعددة، مفيد للإشارات الغامضة:
entity_linking:
enabled: true
multi_select: true
knowledge_bases:
- name: wikidata
type: wikidata
language: enصيغة البيانات
تتضمن النطاقات المرتبطة بالكيانات حقولاً إضافية في المخرجات:
{
"id": "instance_001",
"text": "Albert Einstein was born in Ulm, Germany in 1879.",
"annotations": {
"ner": {
"spans": [
{
"text": "Albert Einstein",
"start": 0,
"end": 15,
"label": "PERSON",
"kb_id": "Q937",
"kb_source": "wikidata",
"kb_label": "Albert Einstein"
},
{
"text": "Ulm",
"start": 28,
"end": 31,
"label": "LOCATION",
"kb_id": "Q3012",
"kb_source": "wikidata",
"kb_label": "Ulm"
}
]
}
}
}أفضل الممارسات
- فعّل البحث التلقائي للكفاءة - يملأ البحث مسبقًا بنص النطاق
- لا تطلب الربط إلا عند الضرورة - لا تعرقل التوسيم إذا لم يُعثر على الكيان
- حدد مهلات مناسبة للشبكات البطيئة
- طابق قاعدة المعرفة مع نوع الكيان - استخدم Wikidata للكيانات العامة، وUMLS للمصطلحات الطبية، وAPIs مخصصة للكيانات المتخصصة
- استخدم الاختيار المتعدد للإشارات الغامضة - الاختصارات، والأسماء الشائعة، والمصطلحات متعددة المعاني
قراءة إضافية
- توسيم النطاقات - إعداد توسيم النطاقات الأساسي
- سلاسل الإشارة المرجعية المشتركة - تجميع إشارات الكيانات
- توسيم الأحداث - هياكل الأحداث متعددة العلاقات
لمزيد من التفاصيل التقنية، راجع الوثائق المصدرية.