Bases de la configuration
Apprenez les fondamentaux des fichiers de configuration Potato.
Bases de la configuration
Potato utilise des fichiers de configuration YAML pour définir les tâches d'annotation. Ce guide couvre les options de configuration essentielles.
Structure du fichier de configuration
Une configuration Potato de base comprend ces sections principales :
yaml
# Task settings
annotation_task_name: "My Annotation Task"
port: 8000
# Data configuration
data_files:
- data.json
item_properties:
id_key: id
text_key: text
# Output settings
output_annotation_dir: "annotation_output/"
output_annotation_format: "json"
# Annotation schemes
annotation_schemes:
- annotation_type: radio
name: my_annotation
labels:
- Label 1
- Label 2
# User settings
allow_all_users: trueParamètres essentiels
Configuration de la tâche et du serveur
yaml
annotation_task_name: "My Task" # Display name for your task
port: 8000 # Port to run the server onConfiguration des données
yaml
data_files:
- data.json # Path to your data file(s)
- more_data.json # You can specify multiple files
item_properties:
id_key: id # Field containing unique ID
text_key: text # Field containing text to annotateFormats de données supportés :
- JSON (
.json) - JSON Lines (
.jsonl) - CSV (
.csv) - TSV (
.tsv)
Configuration de la sortie
yaml
output_annotation_dir: "annotation_output/" # Directory for annotation files
output_annotation_format: "json" # Format: json, jsonl, csv, tsvSchémas d'annotation
Définissez un ou plusieurs schémas d'annotation :
yaml
annotation_schemes:
- annotation_type: radio # Type of annotation
name: sentiment # Internal name
description: "Select the sentiment" # Instructions
labels: # Options for annotators
- Positive
- Negative
- NeutralTypes d'annotation disponibles
| Type | Description |
|---|---|
radio | Sélection à choix unique |
multiselect | Sélection à choix multiples |
likert | Évaluation sur une échelle |
text | Saisie de texte libre |
number | Saisie numérique |
span | Surlignage de segments de texte |
slider | Sélection sur une plage continue |
multirate | Évaluation de plusieurs éléments |
Configuration des utilisateurs
Autoriser tous les utilisateurs
yaml
allow_all_users: trueRestreindre à des utilisateurs spécifiques
yaml
allow_all_users: false
authorized_users:
- user1@example.com
- user2@example.comRépertoire de la tâche
Le paramètre task_dir définit le répertoire racine pour les chemins relatifs :
yaml
task_dir: ./my-task/
data_files:
- data/input.json # Resolves to ./my-task/data/input.jsonExemple complet
Voici une configuration complète pour une tâche d'analyse de sentiment :
yaml
# config.yaml
annotation_task_name: "Sentiment Analysis"
port: 8000
task_dir: ./
# Data
data_files:
- data/tweets.json
item_properties:
id_key: id
text_key: text
context_key: metadata
# Output
output_annotation_dir: "annotation_output/"
output_annotation_format: "json"
# Annotation
annotation_schemes:
- annotation_type: radio
name: sentiment
description: "What is the sentiment expressed in this tweet?"
labels:
- name: Positive
key_value: "1"
- name: Negative
key_value: "2"
- name: Neutral
key_value: "3"
sequential_key_binding: true
# Users
allow_all_users: true
# Assignment
instances_per_annotator: 100
annotation_per_instance: 2Prochaines étapes
- Explorez les Formats de données en détail
- Apprenez les Schémas d'annotation
- Personnalisez l'interface avec la Configuration de l'interface
- Utilisez le Preview CLI pour valider votre configuration