Skip to content
Diese Seite ist in Ihrer Sprache noch nicht verfügbar. Englische Version wird angezeigt.

Coreference Chains

coreference resolution कार्यों के लिए एक ही entity को संदर्भित करने वाले text span को समूहित करें।

Coreference Chains

Coreference एनोटेशन एनोटेटर्स को उन text span को समूहित करने की अनुमति देता है जो एक ही entity को संदर्भित करते हैं। यह entity resolution, pronoun resolution, और discourse analysis के लिए आवश्यक है।

अवलोकन

एक coreference chain उल्लेखों (text span) का एक संग्रह है जो सभी एक ही वास्तविक-दुनिया की entity को संदर्भित करते हैं। उदाहरण के लिए:

"Marie Curie एक भौतिक विज्ञानी थीं। उन्होंने नोबेल पुरस्कार जीता। वह वैज्ञानिक ने अपने क्षेत्र को हमेशा के लिए बदल दिया।"

"Marie Curie", "उन्होंने", "वह वैज्ञानिक", और "अपने" span सभी एक ही व्यक्ति को संदर्भित करते हैं और एक एकल coreference chain बनाते हैं।

त्वरित प्रारंभ

Coreference एनोटेशन के लिए दो स्कीमा घटकों की आवश्यकता होती है:

  1. उल्लेख बनाने के लिए एक span स्कीमा
  2. उल्लेखों को chain में समूहित करने के लिए एक coreference स्कीमा
yaml
annotation_schemes:
  - annotation_type: span
    name: mentions
    description: Highlight all entity mentions
    labels:
      - name: MENTION
        tooltip: "Any reference to an entity"
    sequential_key_binding: true
 
  - annotation_type: coreference
    name: coref_chains
    description: Group mentions that refer to the same entity
    span_schema: mentions
    allow_singletons: true

कॉन्फ़िगरेशन विकल्प

फ़ील्डप्रकारडिफ़ॉल्टविवरण
annotation_typestringआवश्यक"coreference" होना चाहिए
namestringआवश्यकइस स्कीमा के लिए अद्वितीय पहचानकर्ता
descriptionstringआवश्यकएनोटेटर्स को दिखाए जाने वाले निर्देश
span_schemastringआवश्यकउल्लेख प्रदान करने वाले span स्कीमा का नाम
entity_typeslist[]entity प्रकार श्रेणियों की सूची
allow_singletonsbooleantrueकेवल एक उल्लेख वाली chain की अनुमति दें
visual_display.highlight_modestring"background"दृश्य शैली: "background", "bracket", या "underline"

उदाहरण

Entity प्रकारों के साथ

entity प्रकार के आधार पर chain वर्गीकृत करें:

yaml
annotation_schemes:
  - annotation_type: span
    name: ner
    description: Mark named entities
    labels:
      - name: ENTITY
        tooltip: "Any named entity mention"
 
  - annotation_type: coreference
    name: coref
    description: Create coreference chains
    span_schema: ner
    entity_types:
      - name: PERSON
        color: "#6E56CF"
      - name: ORGANIZATION
        color: "#22C55E"
      - name: LOCATION
        color: "#3B82F6"
      - name: OTHER
        color: "#F59E0B"

Singleton के बिना

उन कार्यों के लिए जहाँ प्रत्येक उल्लेख कम से कम एक अन्य उल्लेख से जुड़ा होना चाहिए:

yaml
annotation_schemes:
  - annotation_type: span
    name: mentions
    description: Highlight co-referring mentions
    labels:
      - name: MENTION
 
  - annotation_type: coreference
    name: strict_coref
    description: All mentions must be part of a chain with at least 2 mentions
    span_schema: mentions
    allow_singletons: false

कस्टम दृश्य प्रदर्शन

yaml
annotation_schemes:
  - annotation_type: coreference
    name: coref
    description: Link coreference chains
    span_schema: mentions
    visual_display:
      highlight_mode: "underline"  # Options: background, bracket, underline

उपयोगकर्ता इंटरफ़ेस

Chain बनाना

  1. उल्लेख बनाएँ: सभी entity उल्लेखों को हाइलाइट करने के लिए span एनोटेशन टूल का उपयोग करें
  2. उल्लेख चुनें: उन हाइलाइट किए गए span पर क्लिक करें जिन्हें आप chain करना चाहते हैं
  3. Chain बनाएँ: चयनित उल्लेखों को समूहित करने के लिए "New Chain" पर क्लिक करें

Chain प्रबंधन

  • Chain में जोड़ें: अतिरिक्त उल्लेख चुनें और "Add to Chain" पर क्लिक करें
  • Chain मर्ज करें: कई chain चुनें और उन्हें मिलाने के लिए "Merge Chains" पर क्लिक करें
  • उल्लेख हटाएँ: एक उल्लेख चुनें और उसे अपनी chain से हटाने के लिए "Remove Mention" पर क्लिक करें

रंग कोडिंग

प्रत्येक chain को स्वचालित रूप से एक अलग रंग असाइन किया जाता है। एक ही chain में उल्लेख एक ही रंग साझा करते हैं, जिससे chain सदस्यता को दृश्य रूप से पहचानना आसान हो जाता है।

आउटपुट फॉर्मेट

Coreference एनोटेशन span लिंक के रूप में सहेजे जाते हैं:

json
{
  "span_links": [
    {
      "schema": "coref_chains",
      "link_type": "coreference",
      "span_ids": ["mentions_0_5_MENTION", "mentions_34_37_MENTION", "mentions_72_85_MENTION"],
      "entity_type": "PERSON"
    },
    {
      "schema": "coref_chains",
      "link_type": "coreference",
      "span_ids": ["mentions_15_23_MENTION", "mentions_95_97_MENTION"],
      "entity_type": "ORGANIZATION"
    }
  ]
}

अनुशंसित कार्यप्रवाह

  1. पहला दौर - पाठ पढ़ें और सभी entity उल्लेखों को हाइलाइट करें
  2. दूसरा दौर - उल्लेखों को coreference chain में समूहित करें
  3. समीक्षा - जाँचें कि सभी उल्लेख सही ढंग से असाइन किए गए हैं और कोई chain गायब नहीं है

सर्वोत्तम प्रथाएँ

  1. स्पष्ट उल्लेख सीमाएँ परिभाषित करें - स्थापित करें कि उल्लेख क्या माना जाता है
  2. नेस्टेड उल्लेखों को संभालें - "Microsoft के CEO" जैसे मामलों को कैसे संभालना है, तय करें
  3. सामान्य संदर्भों पर विचार करें - निर्धारित करें कि क्या सामान्य संदर्भ शामिल किए जाने चाहिए
  4. एनोटेटर्स को प्रशिक्षित करें - coreference जटिल है; उदाहरण और अभ्यास राउंड प्रदान करें
  5. entity प्रकारों का विरल उपयोग करें - बहुत अधिक डेटा गुणवत्ता में सुधार किए बिना एनोटेशन को धीमा कर सकते हैं

अधिक पढ़ें

कार्यान्वयन विवरण के लिए, स्रोत दस्तावेज़ीकरण देखें।