Comparação Pareada
Configure comparações lado a lado no Potato para aprendizado de preferências, testes A/B e avaliação de qualidade de saídas com ordem de apresentação aleatória.
A comparação pareada permite que os anotadores comparem dois itens lado a lado e indiquem sua preferência. Ela oferece dois modos:
- Modo Binário (padrão): clique no bloco preferido (A ou B), com botão de empate opcional
- Modo de Escala: use um controle deslizante para avaliar o quanto uma opção é preferida em relação à outra
Os casos de uso comuns incluem comparar saídas de modelos, aprendizado de preferências para RLHF, comparação de qualidade de traduções ou resumos e testes A/B.
Comparação pareada lado a lado para anotação de preferência no Potato
Modo Binário
O modo binário exibe dois blocos clicáveis. Os anotadores clicam na opção preferida.
annotation_schemes:
- annotation_type: pairwise
name: preference
description: "Which response is better?"
mode: binary
# Data source - key in instance data containing items to compare
items_key: "responses"
# Display options
show_labels: true
labels:
- "Response A"
- "Response B"
# Tie option
allow_tie: true
tie_label: "No preference"
# Keyboard shortcuts
sequential_key_binding: true
# Validation
label_requirement:
required: trueModo de Escala
O modo de escala exibe um controle deslizante entre dois itens, permitindo que os anotadores indiquem o grau de preferência.
annotation_schemes:
- annotation_type: pairwise
name: preference_scale
description: "Rate how much better A is than B"
mode: scale
items_key: "responses"
labels:
- "Response A"
- "Response B"
# Scale configuration
scale:
min: -3 # Negative = prefer left item (A)
max: 3 # Positive = prefer right item (B)
step: 1
default: 0
# Endpoint labels
labels:
min: "A is much better"
max: "B is much better"
center: "Equal"
label_requirement:
required: trueFormato dos Dados
O esquema espera dados de instância com uma lista de itens a comparar:
{"id": "1", "responses": ["Response A text", "Response B text"]}
{"id": "2", "responses": ["First option here", "Second option here"]}A configuração items_key especifica qual campo contém os itens a comparar. O campo deve conter uma lista com pelo menos 2 itens.
Atalhos de Teclado
No modo binário com sequential_key_binding: true:
| Tecla | Ação |
|---|---|
1 | Selecionar a opção A |
2 | Selecionar a opção B |
0 | Selecionar empate/sem preferência (se allow_tie: true) |
O modo de escala usa interação com o controle deslizante.
Formato de Saída
Modo Binário
{
"preference": {
"selection": "A"
}
}Com empate:
{
"preference": {
"selection": "tie"
}
}Modo de Escala
Valores negativos indicam preferência por A, positivos por B e zero indica igualdade:
{
"preference_scale": {
"scale_value": "-2"
}
}Exemplos
Comparação Binária Básica
annotation_schemes:
- annotation_type: pairwise
name: quality
description: "Which text is higher quality?"
labels: ["Text A", "Text B"]
allow_tie: trueComparação Multiaspecto
Compare em múltiplas dimensões:
annotation_schemes:
- annotation_type: pairwise
name: fluency
description: "Which response is more fluent?"
labels: ["Response A", "Response B"]
- annotation_type: pairwise
name: relevance
description: "Which response is more relevant?"
labels: ["Response A", "Response B"]
- annotation_type: pairwise
name: overall
description: "Which response is better overall?"
labels: ["Response A", "Response B"]
allow_tie: trueEscala de Preferência com Intervalo Personalizado
annotation_schemes:
- annotation_type: pairwise
name: sentiment_comparison
description: "Compare the sentiment of these two statements"
mode: scale
labels: ["Statement A", "Statement B"]
scale:
min: -5
max: 5
step: 1
labels:
min: "A is much more positive"
max: "B is much more positive"
center: "Equal sentiment"Coleta de Preferências para RLHF
annotation_schemes:
- annotation_type: pairwise
name: overall
description: "Overall, which response is better?"
labels: ["Response A", "Response B"]
allow_tie: true
sequential_key_binding: true
- annotation_type: multiselect
name: criteria
description: "What factors influenced your decision?"
labels:
- Accuracy
- Helpfulness
- Clarity
- Safety
- Completeness
- annotation_type: text
name: notes
description: "Additional notes (optional)"
multiline: true
required: falseEstilização
A anotação pareada usa variáveis CSS do sistema de temas. Adicione CSS personalizado para customizar os blocos:
/* Make tiles taller */
.pairwise-tile {
min-height: 200px;
}
/* Change selected tile highlight */
.pairwise-tile.selected {
border-color: #10b981;
background-color: rgba(16, 185, 129, 0.1);
}Boas Práticas
- Use rótulos claros e distintos - os anotadores devem entender as opções imediatamente
- Considere as opções de empate com cuidado - às vezes forçar uma escolha é apropriado
- Use atalhos de teclado - acelera bastante a anotação
- Adicione campos de justificativa - ajudam a entender o raciocínio e melhoram a qualidade dos dados
- Teste com seus dados - garanta que a exibição funcione bem com o comprimento do seu conteúdo
Leitura Adicional
- Árvores de Conversa - Para comparações ramificadas complexas
- Recursos de Produtividade - Atalhos de teclado
Para detalhes de implementação, consulte a documentação de origem.