O destaque de palavras-chave com IA puxa o olhar do anotador para os termos, entidades ou padrões que importam em um trecho de texto. Este guia percorre o suporte de IA embutido no Potato e como configurá-lo para que as palavras-chave relevantes sejam destacadas por conta própria.

Por que usar o destaque de palavras-chave?

Ele orienta os anotadores para a parte do texto que de fato importa, o que significa que eles encontram a informação principal mais rápido e têm menos chance de passar batido por um termo importante. Como o destaque vem de um LLM, ele pode se adaptar ao contexto de cada item em vez de depender de uma lista fixa de palavras.

Para entender como funcionam o destaque de opções e de palavras-chave do Potato por baixo dos panos, consulte a documentação de origem.

Destaque básico com IA

O Potato se apoia no seu sistema de suporte de IA para encontrar e destacar palavras-chave importantes. Aqui está uma configuração mínima:

yaml

annotation_task_name: "Keyword Highlighted Annotation"
 
data_files:
  - path: "data/reviews.json"
    format: json
 
item_properties:
  id_key: id
  text_key: text
 
annotation_schemes:
  - annotation_type: radio
    name: sentiment
    description: "What is the overall sentiment?"
    labels:
      - Positive
      - Negative
      - Neutral
 
ai_support:
  enabled: true
  endpoint_type: openai
 
  ai_config:
    model: gpt-4
    api_key: ${OPENAI_API_KEY}
    temperature: 0.3
    max_tokens: 500
 
  features:
    keyword_highlighting:
      enabled: true
      # Highlights are rendered as box overlays on the text

Quando o destaque de palavras-chave com IA está ativado, os termos relevantes são destacados automaticamente no texto da anotação:

Destaque de palavras-chave com IA na interface de anotação Palavras-chave e entidades importantes são destacadas automaticamente para guiar a atenção do anotador

Usando diferentes provedores de IA

OpenAI

yaml

ai_support:
  enabled: true
  endpoint_type: openai
 
  ai_config:
    model: gpt-4o
    api_key: ${OPENAI_API_KEY}
    temperature: 0.3
    max_tokens: 500
 
  features:
    keyword_highlighting:
      enabled: true

Anthropic Claude

yaml

ai_support:
  enabled: true
  endpoint_type: anthropic
 
  ai_config:
    model: claude-3-sonnet-20240229
    api_key: ${ANTHROPIC_API_KEY}
    temperature: 0.3
    max_tokens: 500
 
  features:
    keyword_highlighting:
      enabled: true
      # Highlights are rendered as box overlays on the text

Ollama Local (Sem Custos de API)

yaml

ai_support:
  enabled: true
  endpoint_type: ollama
 
  ai_config:
    model: llama2
    base_url: http://localhost:11434
 
  features:
    keyword_highlighting:
      enabled: true
      # Highlights are rendered as box overlays on the text

Combinando recursos

Os recursos de IA se acumulam, e costumam ser mais úteis juntos do que isolados:

yaml

ai_support:
  enabled: true
  endpoint_type: openai
 
  ai_config:
    model: gpt-4
    api_key: ${OPENAI_API_KEY}
    temperature: 0.3
    max_tokens: 500
 
  features:
    # Highlight important keywords
    keyword_highlighting:
      enabled: true
      # Highlights are rendered as box overlays on the text
 
    # Show contextual hints
    hints:
      enabled: true
 
    # Suggest labels for consideration
    label_suggestions:
      enabled: true
      show_confidence: true

Exemplo de configuração completa

Aqui está uma configuração completa para anotação ciente de entidades com destaque por IA:

yaml

annotation_task_name: "Entity-Aware Annotation"
 
data_files:
  - path: "data/documents.json"
    format: json
 
item_properties:
  id_key: id
  text_key: text
 
annotation_schemes:
  - annotation_type: span
    name: entities
    labels:
      - name: PERSON
        color: "#FECACA"
      - name: ORG
        color: "#BBF7D0"
      - name: LOCATION
        color: "#BFDBFE"
 
ai_support:
  enabled: true
  endpoint_type: openai
 
  ai_config:
    model: gpt-4
    api_key: ${OPENAI_API_KEY}
    temperature: 0.3
    max_tokens: 500
 
  features:
    keyword_highlighting:
      enabled: true
      # Highlights are rendered as box overlays on the text
    hints:
      enabled: true
    label_suggestions:
      enabled: true
      show_confidence: true
 
  cache_config:
    disk_cache:
      enabled: true
      path: "ai_cache/cache.json"
    prefetch:
      warm_up_page_count: 50
      on_next: 3
      on_prev: 2
 
output_annotation_dir: "output/"
export_annotation_format: json
allow_all_users: true

Cache para desempenho

Ative o cache para reduzir as chamadas de API e acelerar as respostas:

yaml

ai_support:
  enabled: true
  endpoint_type: openai
 
  ai_config:
    model: gpt-4
    api_key: ${OPENAI_API_KEY}
 
  features:
    keyword_highlighting:
      enabled: true
 
  cache_config:
    disk_cache:
      enabled: true
      path: "ai_cache/cache.json"
 
    # Pre-generate highlights on startup and prefetch upcoming
    prefetch:
      warm_up_page_count: 100
      on_next: 5
      on_prev: 2

Dicas

Escolha cores de destaque que combinem bem com o seu esquema de anotação em vez de competir com ele. Mantenha o cache ligado para não pagar duas vezes pelo mesmo conteúdo. Se você anota em alto volume, o Ollama roda localmente e dispensa a conta de API por completo. E lembre-se de que os recursos se acumulam: o destaque de palavras-chave combina naturalmente com dicas e sugestões de rótulos.

Documentação completa em /docs/features/ai-support.