Rótulo Suave
Configure a anotação de rótulo suave no Potato para alocar distribuições de probabilidade entre categorias usando deslizadores que devem somar um total fixo.
O esquema de anotação de rótulo suave permite que os anotadores atribuam distribuições de probabilidade entre múltiplas categorias em vez de tomar uma única decisão de classificação rígida. Os anotadores usam deslizadores para distribuir um total fixo (por exemplo, 100 pontos) entre os rótulos, capturando o grau de incerteza ou sobreposição entre as categorias.
Visão Geral
A rotulagem suave é útil quando os itens podem pertencer parcialmente a várias categorias. Em vez de forçar os anotadores a escolher um rótulo, este esquema permite que eles expressem a confiança relativa entre todas as opções. Os deslizadores estão vinculados de modo que sempre somem o total configurado, e um gráfico de distribuição opcional fornece feedback visual.
Início Rápido
annotation_schemes:
- annotation_type: soft_label
name: sentiment_distribution
description: Distribute 100 points across sentiment categories based on how much each applies.
labels: ["Positive", "Neutral", "Negative"]
total: 100Opções de Configuração
| Campo | Tipo | Padrão | Descrição |
|---|---|---|---|
annotation_type | string | Obrigatório | Deve ser "soft_label" |
name | string | Obrigatório | Identificador único para este esquema |
description | string | Obrigatório | Instruções exibidas aos anotadores |
labels | array | Obrigatório | Lista de rótulos de categoria (mínimo 2) |
total | integer | 100 | A soma fixa que todos os deslizadores devem totalizar |
min_per_label | integer | 0 | Valor mínimo que cada rótulo deve receber |
show_distribution_chart | boolean | true | Exibe um gráfico de pizza ou barras mostrando a distribuição atual |
label_requirement.required | boolean | false | Se a anotação deve ser concluída antes de prosseguir |
Exemplos
Distribuição de Sentimento
annotation_schemes:
- annotation_type: soft_label
name: sentiment_distribution
description: How much does each sentiment apply to this text?
labels: ["Positive", "Neutral", "Negative"]
total: 100
show_distribution_chart: trueIntensidade de Emoção
annotation_schemes:
- annotation_type: soft_label
name: emotion_mix
description: Distribute points to reflect the mix of emotions in this utterance.
labels: ["Joy", "Sadness", "Anger", "Fear", "Surprise", "Disgust"]
total: 100
min_per_label: 0
show_distribution_chart: trueRelevância de Tópico
annotation_schemes:
- annotation_type: soft_label
name: topic_relevance
description: How relevant is this document to each topic?
labels: ["Politics", "Sports", "Technology", "Entertainment"]
total: 100
label_requirement:
required: trueAlocação Mínima Forçada
annotation_schemes:
- annotation_type: soft_label
name: genre_mix
description: Allocate points across genres. Each genre must receive at least 5 points.
labels: ["Rock", "Pop", "Jazz", "Classical", "Electronic"]
total: 100
min_per_label: 5Formato de Saída
{
"sentiment_distribution": {
"labels": {
"Positive": 45,
"Neutral": 30,
"Negative": 25
}
}
}Os valores sempre somam o total configurado.
Boas Práticas
- Use quando as categorias se sobrepõem - os rótulos suaves são ideais quando os itens realmente pertencem a várias categorias em graus diferentes
- Mantenha a quantidade de rótulos gerenciável - mais de 6-7 rótulos torna a interface de deslizadores difícil de usar
- Defina um total significativo - 100 é intuitivo como porcentagens, mas totais menores funcionam para tarefas mais simples
- Use min_per_label com moderação - forçar alocações mínimas pode enviesar os resultados quando um rótulo realmente não se aplica
- Ative o gráfico de distribuição - o feedback visual ajuda os anotadores a ver sua alocação de relance
Leituras Adicionais
- Escalas Likert - Escalas de avaliação ordinais
- Deslizador - Anotação de valor contínuo único
- Controle de Qualidade - Verificações de atenção e padrões de referência
Para detalhes de implementação, consulte a documentação de origem.