Annotation de dialogues

Annotez des conversations et du texte multi-éléments avec des options d'affichage spéciales.

Potato prend en charge l'annotation de données multi-éléments où chaque instance contient une liste d'éléments textuels. Ceci est couramment utilisé pour :

Annotation de dialogues : Conversations à plusieurs tours
Comparaison par paires : Comparaison de deux ou plusieurs variantes de texte
Tâches multi-documents : Évaluation ou étiquetage de plusieurs textes liés

Format de données

Données d'entrée

Les données multi-éléments sont représentées comme une liste de chaînes dans le champ text :

json

{"id": "conv_001", "text": ["Tom: Isn't this awesome?!", "Sam: Yes! I like you!", "Tom: Great!", "Sam: Awesome! Let's party!"]}
{"id": "conv_002", "text": ["Tom: I am so sorry for that", "Sam: No worries", "Tom: Thanks for your understanding!"]}

Chaque chaîne de la liste représente un élément (par exemple, un tour de dialogue, une variante de document).

Configuration

Configuration de base

yaml

# Data configuration
data_files:
  - data/dialogues.json
 
item_properties:
  id_key: id
  text_key: text
 
# Configure list display
list_as_text:
  text_list_prefix_type: none  # No prefix since speaker names are in text
  alternating_shading: true    # Shade every other turn for readability
 
# Annotation schemes
annotation_schemes:
  - annotation_type: radio
    name: sentiment
    description: "What is the overall sentiment of this conversation?"
    labels:
      - positive
      - neutral
      - negative

Options d'affichage

La configuration list_as_text contrôle l'affichage des éléments de liste :

yaml

list_as_text:
  text_list_prefix_type: alphabet  # Prefix type for items
  horizontal: false                # Layout direction
  alternating_shading: false       # Shade alternate turns

Types de préfixes

Option	Exemple	Idéal pour
`alphabet`	A. B. C.	Comparaisons par paires, options
`number`	1. 2. 3.	Tours séquentiels, listes ordonnées
`bullet`	. . .	Éléments non ordonnés
`none`	(pas de préfixe)	Dialogues avec noms de locuteurs dans le texte

Options de mise en page

Option	Description
`horizontal: false`	Mise en page verticale (défaut) - éléments empilés
`horizontal: true`	Mise en page côte à côte - pour la comparaison par paires
`alternating_shading: true`	Ombre les tours alternés pour les dialogues

Exemples de configuration