Skip to content

Vinculação de Entidades

Como anotar a vinculação de entidades, conectando menções no texto a registros em uma base de conhecimento como o Wikidata, e como montar uma tarefa de vinculação no Potato.

A vinculação de entidades conecta uma menção no texto a um registro específico de uma base de conhecimento, resolvendo "Paris" como a cidade na França e não a pessoa, ou a cidade no Texas. Enquanto o reconhecimento de entidades nomeadas descobre que algo é uma entidade, a vinculação de entidades decide qual entidade do mundo real ela é.

Para contexto, consulte Vinculação de entidades e os alvos comuns Wikidata e Wikipedia. Isso está intimamente relacionado à desambiguação lexical de sentido.

O que os anotadores fazem

  1. Um span de menção é identificado (muitas vezes pré-marcado a partir de uma etapa de NER).
  2. O anotador busca na base de conhecimento e seleciona o registro correspondente.
  3. Se nenhum registro servir, ele marca NIL (não está na base de conhecimento).

O caso NIL é essencial; sem ele, os anotadores encaixam menções à força em registros errados e corrompem os dados.

Como montar no Potato

O Potato suporta vinculação de entidades com uma busca por digitação (typeahead) numa base de conhecimento (Wikidata, UMLS ou uma lista personalizada), de modo que os anotadores escolham entre candidatos reais em vez de digitar IDs. O exemplo de vinculação de entidades é um caso funcional.

yaml
annotation_schemes:
  - annotation_type: span
    name: mentions
    description: "Mark the mention to link."
    labels: [Entity]
  - annotation_type: text
    name: kb_id
    description: "Search the knowledge base and enter the matching ID, or write NIL if none fits."

Considerações de qualidade

  • Qualidade dos candidatos. Um bom typeahead com descrições reduz escolhas erradas muito mais do que diretrizes mais longas.
  • Padrões para ambiguidade. Diga aos anotadores o que fazer quando dois registros parecerem igualmente válidos.
  • Granularidade. Vincular à empresa ou à subsidiária? Ao filme ou à franquia? Decida de uma vez.

Leitura adicional