Comparación por Pares
Compara pares de elementos para evaluación de preferencia y calidad.
Comparación por Pares
La comparación por pares permite a los anotadores comparar dos elementos lado a lado e indicar su preferencia. Soporta dos modos:
- Modo Binario (predeterminado): Haz clic en el mosaico preferido (A o B), con botón de empate opcional
- Modo Escala: Usa un deslizador para calificar cuánto se prefiere una opción sobre la otra
Los casos de uso comunes incluyen comparar salidas de modelos, aprendizaje de preferencias para RLHF, comparación de calidad de traducciones o resúmenes, y pruebas A/B.
Modo Binario
El modo binario muestra dos mosaicos en los que se puede hacer clic. Los anotadores hacen clic en su opción preferida.
annotation_schemes:
- annotation_type: pairwise
name: preference
description: "Which response is better?"
mode: binary
# Data source - key in instance data containing items to compare
items_key: "responses"
# Display options
show_labels: true
labels:
- "Response A"
- "Response B"
# Tie option
allow_tie: true
tie_label: "No preference"
# Keyboard shortcuts
sequential_key_binding: true
# Validation
label_requirement:
required: trueModo Escala
El modo escala muestra un deslizador entre dos elementos, permitiendo a los anotadores indicar el grado de preferencia.
annotation_schemes:
- annotation_type: pairwise
name: preference_scale
description: "Rate how much better A is than B"
mode: scale
items_key: "responses"
labels:
- "Response A"
- "Response B"
# Scale configuration
scale:
min: -3 # Negative = prefer left item (A)
max: 3 # Positive = prefer right item (B)
step: 1
default: 0
# Endpoint labels
labels:
min: "A is much better"
max: "B is much better"
center: "Equal"
label_requirement:
required: trueFormato de Datos
El esquema espera datos de instancia con una lista de elementos para comparar:
{"id": "1", "responses": ["Response A text", "Response B text"]}
{"id": "2", "responses": ["First option here", "Second option here"]}La configuración items_key especifica qué campo contiene los elementos a comparar. El campo debe contener una lista con al menos 2 elementos.
Atajos de Teclado
En modo binario con sequential_key_binding: true:
| Tecla | Acción |
|---|---|
1 | Seleccionar opción A |
2 | Seleccionar opción B |
0 | Seleccionar empate/sin preferencia (si allow_tie: true) |
El modo escala usa interacción con deslizador.
Formato de Salida
Modo Binario
{
"preference": {
"selection": "A"
}
}Con empate:
{
"preference": {
"selection": "tie"
}
}Modo Escala
Los valores negativos indican preferencia por A, positivos por B, cero para igual:
{
"preference_scale": {
"scale_value": "-2"
}
}Ejemplos
Comparación Binaria Básica
annotation_schemes:
- annotation_type: pairwise
name: quality
description: "Which text is higher quality?"
labels: ["Text A", "Text B"]
allow_tie: trueComparación Multi-Aspecto
Compara en múltiples dimensiones:
annotation_schemes:
- annotation_type: pairwise
name: fluency
description: "Which response is more fluent?"
labels: ["Response A", "Response B"]
- annotation_type: pairwise
name: relevance
description: "Which response is more relevant?"
labels: ["Response A", "Response B"]
- annotation_type: pairwise
name: overall
description: "Which response is better overall?"
labels: ["Response A", "Response B"]
allow_tie: trueEscala de Preferencia con Rango Personalizado
annotation_schemes:
- annotation_type: pairwise
name: sentiment_comparison
description: "Compare the sentiment of these two statements"
mode: scale
labels: ["Statement A", "Statement B"]
scale:
min: -5
max: 5
step: 1
labels:
min: "A is much more positive"
max: "B is much more positive"
center: "Equal sentiment"Recopilación de Preferencias RLHF
annotation_schemes:
- annotation_type: pairwise
name: overall
description: "Overall, which response is better?"
labels: ["Response A", "Response B"]
allow_tie: true
sequential_key_binding: true
- annotation_type: multiselect
name: criteria
description: "What factors influenced your decision?"
labels:
- Accuracy
- Helpfulness
- Clarity
- Safety
- Completeness
- annotation_type: text
name: notes
description: "Additional notes (optional)"
textarea: true
required: falseEstilos
La anotación por pares usa variables CSS del sistema de temas. Añade CSS personalizado para personalizar los mosaicos:
/* Make tiles taller */
.pairwise-tile {
min-height: 200px;
}
/* Change selected tile highlight */
.pairwise-tile.selected {
border-color: #10b981;
background-color: rgba(16, 185, 129, 0.1);
}Mejores Prácticas
- Usa etiquetas claras y distintas - los anotadores deben entender las opciones instantáneamente
- Considera las opciones de empate cuidadosamente - a veces forzar una elección es apropiado
- Usa atajos de teclado - acelera significativamente la anotación
- Añade campos de justificación - ayuda a entender el razonamiento y mejora la calidad de los datos
- Prueba con tus datos - asegúrate de que la visualización funcione bien con la longitud de tu contenido
Lectura Adicional
- Árboles de Conversación - Para comparaciones ramificadas complejas
- Funcionalidades de Productividad - Atajos de teclado
Para detalles de implementación, consulta la documentación fuente.