Destaque Automático de Palavras-Chave
Configure o destaque de palavras-chave com IA no Potato para chamar a atenção do anotador para termos importantes. Cobre OpenAI, Claude e a configuração de listas de palavras-chave personalizadas.
O destaque de palavras-chave com IA puxa o olhar do anotador para os termos, entidades ou padrões que importam em um trecho de texto. Este guia percorre o suporte de IA embutido no Potato e como configurá-lo para que as palavras-chave relevantes sejam destacadas por conta própria.
Por que usar o destaque de palavras-chave?
Ele orienta os anotadores para a parte do texto que de fato importa, o que significa que eles encontram a informação principal mais rápido e têm menos chance de passar batido por um termo importante. Como o destaque vem de um LLM, ele pode se adaptar ao contexto de cada item em vez de depender de uma lista fixa de palavras.
Para entender como funcionam o destaque de opções e de palavras-chave do Potato por baixo dos panos, consulte a documentação de origem.
Destaque básico com IA
O Potato se apoia no seu sistema de suporte de IA para encontrar e destacar palavras-chave importantes. Aqui está uma configuração mínima:
annotation_task_name: "Keyword Highlighted Annotation"
data_files:
- path: "data/reviews.json"
format: json
item_properties:
id_key: id
text_key: text
annotation_schemes:
- annotation_type: radio
name: sentiment
description: "What is the overall sentiment?"
labels:
- Positive
- Negative
- Neutral
ai_support:
enabled: true
endpoint_type: openai
ai_config:
model: gpt-4
api_key: ${OPENAI_API_KEY}
temperature: 0.3
max_tokens: 500
features:
keyword_highlighting:
enabled: true
# Highlights are rendered as box overlays on the textQuando o destaque de palavras-chave com IA está ativado, os termos relevantes são destacados automaticamente no texto da anotação:
Palavras-chave e entidades importantes são destacadas automaticamente para guiar a atenção do anotador
Usando diferentes provedores de IA
OpenAI
ai_support:
enabled: true
endpoint_type: openai
ai_config:
model: gpt-4o
api_key: ${OPENAI_API_KEY}
temperature: 0.3
max_tokens: 500
features:
keyword_highlighting:
enabled: true
Anthropic Claude
ai_support:
enabled: true
endpoint_type: anthropic
ai_config:
model: claude-3-sonnet-20240229
api_key: ${ANTHROPIC_API_KEY}
temperature: 0.3
max_tokens: 500
features:
keyword_highlighting:
enabled: true
# Highlights are rendered as box overlays on the textOllama Local (Sem Custos de API)
ai_support:
enabled: true
endpoint_type: ollama
ai_config:
model: llama2
base_url: http://localhost:11434
features:
keyword_highlighting:
enabled: true
# Highlights are rendered as box overlays on the textCombinando recursos
Os recursos de IA se acumulam, e costumam ser mais úteis juntos do que isolados:
ai_support:
enabled: true
endpoint_type: openai
ai_config:
model: gpt-4
api_key: ${OPENAI_API_KEY}
temperature: 0.3
max_tokens: 500
features:
# Highlight important keywords
keyword_highlighting:
enabled: true
# Highlights are rendered as box overlays on the text
# Show contextual hints
hints:
enabled: true
# Suggest labels for consideration
label_suggestions:
enabled: true
show_confidence: trueExemplo de configuração completa
Aqui está uma configuração completa para anotação ciente de entidades com destaque por IA:
annotation_task_name: "Entity-Aware Annotation"
data_files:
- path: "data/documents.json"
format: json
item_properties:
id_key: id
text_key: text
annotation_schemes:
- annotation_type: span
name: entities
labels:
- name: PERSON
color: "#FECACA"
- name: ORG
color: "#BBF7D0"
- name: LOCATION
color: "#BFDBFE"
ai_support:
enabled: true
endpoint_type: openai
ai_config:
model: gpt-4
api_key: ${OPENAI_API_KEY}
temperature: 0.3
max_tokens: 500
features:
keyword_highlighting:
enabled: true
# Highlights are rendered as box overlays on the text
hints:
enabled: true
label_suggestions:
enabled: true
show_confidence: true
cache_config:
disk_cache:
enabled: true
path: "ai_cache/cache.json"
prefetch:
warm_up_page_count: 50
on_next: 3
on_prev: 2
output_annotation_dir: "output/"
export_annotation_format: json
allow_all_users: trueCache para desempenho
Ative o cache para reduzir as chamadas de API e acelerar as respostas:
ai_support:
enabled: true
endpoint_type: openai
ai_config:
model: gpt-4
api_key: ${OPENAI_API_KEY}
features:
keyword_highlighting:
enabled: true
cache_config:
disk_cache:
enabled: true
path: "ai_cache/cache.json"
# Pre-generate highlights on startup and prefetch upcoming
prefetch:
warm_up_page_count: 100
on_next: 5
on_prev: 2Dicas
Escolha cores de destaque que combinem bem com o seu esquema de anotação em vez de competir com ele. Mantenha o cache ligado para não pagar duas vezes pelo mesmo conteúdo. Se você anota em alto volume, o Ollama roda localmente e dispensa a conta de API por completo. E lembre-se de que os recursos se acumulam: o destaque de palavras-chave combina naturalmente com dicas e sugestões de rótulos.
Documentação completa em /docs/features/ai-support.