Skip to content

Extração de relações e eventos

Como anotar relações entre entidades e eventos estruturados com gatilhos e argumentos, usando vínculos de spans e anotação de eventos no Potato.

A extração de relações conecta duas entidades com um vínculo tipado ("Marie Curie, ganhou, Prêmio Nobel"). A extração de eventos vai além: marca um gatilho do evento e os papéis ao seu redor (quem fez o quê, a quem, quando). Ambas transformam texto plano em conhecimento estruturado.

Veja Extração de relações e Extração de eventos para mais contexto.

Relações: vincular spans

Uma anotação de relação tem três partes: um span de origem, um span de destino e um tipo de relação. No Potato, os anotadores primeiro marcam os spans e depois traçam um vínculo direcionado e tipado entre eles (vínculo de spans).

yaml
annotation_schemes:
  - annotation_type: span
    name: entities
    description: "Mark the entities involved."
    labels: [PERSON, ORGANIZATION, AWARD]
  - annotation_type: span_link
    name: relations
    description: "Draw a link between two entities and choose the relation."
    labels: [won, works_for, located_in, founded_by]

As relações são direcionais, então decida e documente a direção de cada tipo (o "founded_by" aponta da empresa para a pessoa, ou o contrário?).

Eventos: gatilhos e argumentos

Um evento é ancorado por uma palavra gatilho (muitas vezes um verbo como "acquired") e tem argumentos que preenchem papéis tipados (Comprador, Vendedor, Preço, Data). O tipo de anotação de eventos do Potato permite que os anotadores marquem o gatilho e anexem spans rotulados com papéis.

A vitrine de anotação de eventos demonstra uma configuração funcional de gatilho e argumentos.

Por que essas tarefas são difíceis

  • O espaço de rótulos é grande, então a concordância cai. Mantenha os tipos de relação e de papel em pouca quantidade e bem definidos.
  • Os anotadores precisam acertar primeiro os spans; os erros se acumulam. Considere anotar entidades em uma primeira passagem e relações em uma segunda.
  • A saída estruturada torna não triviais as métricas de concordância, meça no nível que importa para você (gatilho correto, argumento correto, evento completo correto).

Leitura adicional