Controle de Qualidade
Garanta a qualidade das anotações no Potato com itens de verificação de atenção, validação por padrão-ouro, sobreposição configurável de anotadores e relatórios de Alpha de Krippendorff.
O Potato oferece recursos abrangentes de controle de qualidade para garantir anotações de alta qualidade. Isso inclui verificações de atenção, padrões-ouro, suporte a pré-anotação e métricas de concordância em tempo real.
Visão Geral
O controle de qualidade no Potato consiste em quatro recursos principais:
- Verificações de Atenção - Verificam o engajamento do anotador com itens de resposta conhecida
- Padrões-Ouro - Acompanham a precisão em relação a itens rotulados por especialistas
- Suporte a Pré-anotação - Pré-preenchem formulários com previsões do modelo
- Métricas de Concordância - Calculam a concordância entre anotadores em tempo real
Verificações de Atenção
Verificações de atenção são itens com respostas corretas conhecidas que confirmam se os anotadores estão prestando atenção e não clicando aleatoriamente.
Configuração
attention_checks:
enabled: true
items_file: "attention_checks.json"
# How often to inject attention checks
frequency: 10 # Insert one every 10 items
# OR
probability: 0.1 # 10% chance per item
# Optional: flag suspiciously fast responses
min_response_time: 3.0 # Flag if answered in < 3 seconds
# Failure handling
failure_handling:
warn_threshold: 2 # Show warning after 2 failures
warn_message: "Please read items carefully before answering."
block_threshold: 5 # Block user after 5 failures
block_message: "You have been blocked due to too many incorrect responses."Arquivo de Itens de Verificação de Atenção
[
{
"id": "attn_001",
"text": "Please select 'Positive' for this item to verify you are reading carefully.",
"expected_answer": {
"sentiment": "positive"
}
}
]Padrões-Ouro
Padrões-ouro são itens rotulados por especialistas usados para medir a precisão do anotador. Por padrão, os padrões-ouro são silenciosos — os resultados são registrados para revisão do administrador, mas os anotadores não veem feedback.
Configuração
gold_standards:
enabled: true
items_file: "gold_standards.json"
# How to use gold standards
mode: "mixed" # Options: training, mixed, separate
frequency: 20 # Insert one every 20 items
# Accuracy requirements
accuracy:
min_threshold: 0.7 # Minimum required accuracy (70%)
evaluation_count: 10 # Evaluate after this many gold items
# Feedback settings (disabled by default)
feedback:
show_correct_answer: false
show_explanation: false
# Auto-promotion from high-agreement items
auto_promote:
enabled: true
min_annotators: 3
agreement_threshold: 1.0 # 1.0 = unanimousArquivo de Itens de Padrão-Ouro
[
{
"id": "gold_001",
"text": "The service was absolutely terrible and I will never return.",
"gold_label": {
"sentiment": "negative"
},
"explanation": "Strong negative language clearly indicates negative sentiment.",
"difficulty": "easy"
}
]Promoção Automática
Os itens podem se tornar padrões-ouro automaticamente quando vários anotadores concordam:
gold_standards:
auto_promote:
enabled: true
min_annotators: 3 # Wait for at least 3 annotators
agreement_threshold: 1.0 # 100% must agree (unanimous)Suporte a Pré-anotação
A pré-anotação permite pré-preencher formulários de anotação com previsões do modelo, útil para aprendizado ativo e fluxos de correção.
Configuração
pre_annotation:
enabled: true
field: "predictions" # Field in data containing predictions
allow_modification: true # Can annotators change pre-filled values?
show_confidence: true
highlight_low_confidence: 0.7Formato de Dados
Inclua previsões nos seus itens de dados:
{
"id": "item_001",
"text": "I love this product!",
"predictions": {
"sentiment": "positive",
"confidence": 0.92
}
}Métricas de Concordância
Métricas de concordância entre anotadores em tempo real usando o alpha de Krippendorff estão disponíveis no painel do administrador.
Configuração
agreement_metrics:
enabled: true
min_overlap: 2 # Minimum annotators per item
auto_refresh: true
refresh_interval: 60 # Seconds between updatesInterpretando o Alpha de Krippendorff
| Valor de Alpha | Interpretação |
|---|---|
| α ≥ 0.8 | Boa concordância - confiável para a maioria dos propósitos |
| 0.67 ≤ α ≤ 0.8 | Concordância provisória - tire conclusões provisórias |
| 0.33 ≤ α ≤ 0.67 | Baixa concordância - revise as diretrizes |
| α ≤ 0.33 | Concordância fraca - problemas significativos |
Integração com o Painel do Administrador
Veja as métricas de controle de qualidade no painel do administrador em /admin:
- Verificações de Atenção: Taxas gerais de aprovação/reprovação, estatísticas por anotador
- Padrões-Ouro: Precisão por anotador, análise de dificuldade por item
- Concordância: Alpha de Krippendorff por esquema com interpretação
- Itens Promovidos Automaticamente: Lista de itens promovidos por alta concordância
Endpoints da API
Métricas de Controle de Qualidade
GET /admin/api/quality_controlRetorna estatísticas de verificação de atenção e padrão-ouro.
Métricas de Concordância
GET /admin/api/agreementRetorna o alpha de Krippendorff por esquema com interpretação.
Exemplo Completo
annotation_task_name: "Sentiment Analysis with Quality Control"
annotation_schemes:
- name: sentiment
annotation_type: radio
labels: [positive, negative, neutral]
description: "Select the sentiment of the text"
attention_checks:
enabled: true
items_file: "data/attention_checks.json"
frequency: 15
failure_handling:
warn_threshold: 2
block_threshold: 5
gold_standards:
enabled: true
items_file: "data/gold_standards.json"
mode: mixed
frequency: 25
accuracy:
min_threshold: 0.7
evaluation_count: 5
agreement_metrics:
enabled: true
min_overlap: 2
refresh_interval: 60Solução de Problemas
Verificações de atenção não aparecem
- Verifique se o caminho de
items_fileestá correto (relativo ao diretório da tarefa) - Confira se os itens têm os campos obrigatórios (
id,expected_answer) - Certifique-se de que
frequencyouprobabilityestá definido
Métricas de concordância exibindo "No items with N+ annotators"
- Garanta que os itens foram anotados por vários usuários
- Reduza
min_overlapse necessário - Verifique se as anotações estão sendo salvas corretamente
Leitura Adicional
- Fase de Treinamento - Qualificação de anotadores
- Painel do Administrador - Monitoramento de métricas
- Atribuição de Tarefas - Controle da distribuição de anotações
Para detalhes de implementação, consulte a documentação de origem.