Coreference Chains
coreference resolution कार्यों के लिए एक ही entity को संदर्भित करने वाले text span को समूहित करें।
Coreference Chains
Coreference एनोटेशन एनोटेटर्स को उन text span को समूहित करने की अनुमति देता है जो एक ही entity को संदर्भित करते हैं। यह entity resolution, pronoun resolution, और discourse analysis के लिए आवश्यक है।
अवलोकन
एक coreference chain उल्लेखों (text span) का एक संग्रह है जो सभी एक ही वास्तविक-दुनिया की entity को संदर्भित करते हैं। उदाहरण के लिए:
"Marie Curie एक भौतिक विज्ञानी थीं। उन्होंने नोबेल पुरस्कार जीता। वह वैज्ञानिक ने अपने क्षेत्र को हमेशा के लिए बदल दिया।"
"Marie Curie", "उन्होंने", "वह वैज्ञानिक", और "अपने" span सभी एक ही व्यक्ति को संदर्भित करते हैं और एक एकल coreference chain बनाते हैं।
त्वरित प्रारंभ
Coreference एनोटेशन के लिए दो स्कीमा घटकों की आवश्यकता होती है:
- उल्लेख बनाने के लिए एक span स्कीमा
- उल्लेखों को chain में समूहित करने के लिए एक coreference स्कीमा
annotation_schemes:
- annotation_type: span
name: mentions
description: Highlight all entity mentions
labels:
- name: MENTION
tooltip: "Any reference to an entity"
sequential_key_binding: true
- annotation_type: coreference
name: coref_chains
description: Group mentions that refer to the same entity
span_schema: mentions
allow_singletons: trueकॉन्फ़िगरेशन विकल्प
| फ़ील्ड | प्रकार | डिफ़ॉल्ट | विवरण |
|---|---|---|---|
annotation_type | string | आवश्यक | "coreference" होना चाहिए |
name | string | आवश्यक | इस स्कीमा के लिए अद्वितीय पहचानकर्ता |
description | string | आवश्यक | एनोटेटर्स को दिखाए जाने वाले निर्देश |
span_schema | string | आवश्यक | उल्लेख प्रदान करने वाले span स्कीमा का नाम |
entity_types | list | [] | entity प्रकार श्रेणियों की सूची |
allow_singletons | boolean | true | केवल एक उल्लेख वाली chain की अनुमति दें |
visual_display.highlight_mode | string | "background" | दृश्य शैली: "background", "bracket", या "underline" |
उदाहरण
Entity प्रकारों के साथ
entity प्रकार के आधार पर chain वर्गीकृत करें:
annotation_schemes:
- annotation_type: span
name: ner
description: Mark named entities
labels:
- name: ENTITY
tooltip: "Any named entity mention"
- annotation_type: coreference
name: coref
description: Create coreference chains
span_schema: ner
entity_types:
- name: PERSON
color: "#6E56CF"
- name: ORGANIZATION
color: "#22C55E"
- name: LOCATION
color: "#3B82F6"
- name: OTHER
color: "#F59E0B"Singleton के बिना
उन कार्यों के लिए जहाँ प्रत्येक उल्लेख कम से कम एक अन्य उल्लेख से जुड़ा होना चाहिए:
annotation_schemes:
- annotation_type: span
name: mentions
description: Highlight co-referring mentions
labels:
- name: MENTION
- annotation_type: coreference
name: strict_coref
description: All mentions must be part of a chain with at least 2 mentions
span_schema: mentions
allow_singletons: falseकस्टम दृश्य प्रदर्शन
annotation_schemes:
- annotation_type: coreference
name: coref
description: Link coreference chains
span_schema: mentions
visual_display:
highlight_mode: "underline" # Options: background, bracket, underlineउपयोगकर्ता इंटरफ़ेस
Chain बनाना
- उल्लेख बनाएँ: सभी entity उल्लेखों को हाइलाइट करने के लिए span एनोटेशन टूल का उपयोग करें
- उल्लेख चुनें: उन हाइलाइट किए गए span पर क्लिक करें जिन्हें आप chain करना चाहते हैं
- Chain बनाएँ: चयनित उल्लेखों को समूहित करने के लिए "New Chain" पर क्लिक करें
Chain प्रबंधन
- Chain में जोड़ें: अतिरिक्त उल्लेख चुनें और "Add to Chain" पर क्लिक करें
- Chain मर्ज करें: कई chain चुनें और उन्हें मिलाने के लिए "Merge Chains" पर क्लिक करें
- उल्लेख हटाएँ: एक उल्लेख चुनें और उसे अपनी chain से हटाने के लिए "Remove Mention" पर क्लिक करें
रंग कोडिंग
प्रत्येक chain को स्वचालित रूप से एक अलग रंग असाइन किया जाता है। एक ही chain में उल्लेख एक ही रंग साझा करते हैं, जिससे chain सदस्यता को दृश्य रूप से पहचानना आसान हो जाता है।
आउटपुट फॉर्मेट
Coreference एनोटेशन span लिंक के रूप में सहेजे जाते हैं:
{
"span_links": [
{
"schema": "coref_chains",
"link_type": "coreference",
"span_ids": ["mentions_0_5_MENTION", "mentions_34_37_MENTION", "mentions_72_85_MENTION"],
"entity_type": "PERSON"
},
{
"schema": "coref_chains",
"link_type": "coreference",
"span_ids": ["mentions_15_23_MENTION", "mentions_95_97_MENTION"],
"entity_type": "ORGANIZATION"
}
]
}अनुशंसित कार्यप्रवाह
- पहला दौर - पाठ पढ़ें और सभी entity उल्लेखों को हाइलाइट करें
- दूसरा दौर - उल्लेखों को coreference chain में समूहित करें
- समीक्षा - जाँचें कि सभी उल्लेख सही ढंग से असाइन किए गए हैं और कोई chain गायब नहीं है
सर्वोत्तम प्रथाएँ
- स्पष्ट उल्लेख सीमाएँ परिभाषित करें - स्थापित करें कि उल्लेख क्या माना जाता है
- नेस्टेड उल्लेखों को संभालें - "Microsoft के CEO" जैसे मामलों को कैसे संभालना है, तय करें
- सामान्य संदर्भों पर विचार करें - निर्धारित करें कि क्या सामान्य संदर्भ शामिल किए जाने चाहिए
- एनोटेटर्स को प्रशिक्षित करें - coreference जटिल है; उदाहरण और अभ्यास राउंड प्रदान करें
- entity प्रकारों का विरल उपयोग करें - बहुत अधिक डेटा गुणवत्ता में सुधार किए बिना एनोटेशन को धीमा कर सकते हैं
अधिक पढ़ें
- Span Annotation - Text span बनाना
- Entity Linking - Span को knowledge base से जोड़ना
- Span Linking - अन्य प्रकार के span संबंध
कार्यान्वयन विवरण के लिए, स्रोत दस्तावेज़ीकरण देखें।