Nouveautés

Aperçu des nouvelles fonctionnalités et améliorations dans les versions Potato v2.x.

Cette page couvre les nouvelles fonctionnalités et améliorations des versions Potato v2.x.

Potato 2.2.0

Publié le 20 février 2026

Potato 2.2 est une version majeure avec 9 nouveaux schémas d'annotation, un système d'exportation modulaire, l'estimation de compétence MACE, 55 instruments d'enquête validés et des sources de données distantes.

Nouveaux schémas d'annotation (9)

Annotation d'événements — Structures d'événements N-aires avec segments déclencheurs et rôles d'arguments typés. Annotez des événements comme ATTACK, HIRE et TRAVEL avec des arguments d'entités contraints et une visualisation en arc en étoile.

yaml

annotation_schemes:
  - annotation_type: event_annotation
    name: events
    span_schema: entities
    event_types:
      - type: "ATTACK"
        trigger_labels: ["EVENT_TRIGGER"]
        arguments:
          - role: "attacker"
            entity_types: ["PERSON", "ORGANIZATION"]
            required: true

En savoir plus sur l'annotation d'événements →

Liaison d'entités — Liez les annotations de segments à des bases de connaissances externes (Wikidata, UMLS, API REST personnalisées). Ajoutez un bloc entity_linking: à tout schéma de segments pour activer la recherche et la liaison KB.

En savoir plus sur la liaison d'entités →

Triage — Interface d'acceptation/rejet/passage de type Prodigy pour le filtrage rapide des données. Étiquettes personnalisables, raccourcis clavier et avancement automatique pour une annotation à haut débit.

En savoir plus sur le triage →

Comparaison par paires — Comparez deux éléments en mode binaire (cliquez sur la tuile préférée) ou en mode échelle (curseur). Prend en charge items_key, allow_tie, bloc scale: avec plage configurable.

En savoir plus sur la comparaison par paires →

Arbres de conversation — Annotez des structures de conversation hiérarchiques avec des évaluations par nœud, la sélection de chemins et la comparaison de branches.

En savoir plus sur les arbres de conversation →

Chaînes de coréférence — Regroupez les mentions coréférentes dans des chaînes avec des indicateurs visuels. Prend en charge les types d'entités, le contrôle des singletons et plusieurs modes de surlignage.

En savoir plus sur les chaînes de coréférence →

Masques de segmentation — Nouveaux outils fill, eraser et brush pour la segmentation d'images au niveau pixel.

Boîtes englobantes pour PDF/Documents — Dessinez des boîtes sur les pages PDF pour les tâches d'annotation de documents.

Segments discontinus — allow_discontinuous: true permet de sélectionner des segments de texte non contigus comme un seul segment.

Annotation intelligente

Estimation de compétence MACE — Algorithme EM bayésien variationnel qui estime conjointement les vraies étiquettes et les scores de compétence des annotateurs (0.0-1.0). Fonctionne avec les schémas radio, likert, select et multiselect.

yaml

mace:
  enabled: true
  trigger_every_n: 10
  min_annotations_per_item: 3

En savoir plus sur MACE →

Mise en évidence des options — Mise en évidence basée sur les LLM des options les plus probables pour les tâches d'annotation discrètes. Met en évidence les top-k options avec un indicateur étoile tout en atténuant les options moins probables.

yaml

ai_support:
  option_highlighting:
    enabled: true
    top_k: 3
    dim_opacity: 0.4

En savoir plus sur la mise en évidence des options →

Ordonnancement par diversité — Clustering basé sur les embeddings et échantillonnage en tourniquet pour garantir que les annotateurs voient du contenu diversifié plutôt que des éléments similaires en séquence.

yaml

assignment_strategy: diversity_clustering
diversity_ordering:
  enabled: true
  prefill_count: 100

En savoir plus sur l'ordonnancement par diversité →

Système d'exportation

Un nouveau CLI d'exportation modulaire (python -m potato.export) convertit les annotations en 6 formats standards de l'industrie : COCO, YOLO, Pascal VOC, CoNLL-2003, CoNLL-U et masques de segmentation.

bash

python -m potato.export --config config.yaml --format coco --output ./export/

En savoir plus sur les formats d'exportation →

Sources de données distantes

Chargez des données d'annotation depuis des URL, S3, Google Drive, Dropbox, Hugging Face, Google Sheets et des bases de données SQL via le nouveau bloc de configuration data_sources:. Inclut le chargement partiel, la mise en cache et la gestion des identifiants.

En savoir plus sur les sources de données distantes →

Instruments d'enquête

55 questionnaires validés répartis en 8 catégories (Personnalité, Santé mentale, Affect, Concept de soi, Attitudes sociales, Style de réponse, Format court, Démographie). Utilisez-les dans les phases pré-étude/post-étude avec instrument: "tipi".

En savoir plus sur les instruments d'enquête →

Autres améliorations

Suivi d'objets vidéo avec interpolation de trames clés
Support de fichiers de configuration IA externes
Améliorations de la grille de mise en page des formulaires
Gestionnaires de formats pour PDF, Word, code et tableurs

Potato 2.1.0

Publié le 5 février 2026

Potato 2.1 introduit le système d'affichage des instances, le support IA visuel, la liaison de segments, l'annotation de segments multi-champs et la personnalisation de la mise en page.

Système d'affichage des instances

Un nouveau bloc de configuration instance_display qui sépare l'affichage du contenu de l'annotation. Affichez toute combinaison d'images, vidéos, audio, texte et dialogues aux côtés de tout schéma d'annotation.

yaml

instance_display:
  fields:
    - key: image_url
      type: image
      display_options:
        max_width: 600
        zoomable: true
    - key: description
      type: text
 
annotation_schemes:
  - annotation_type: radio
    name: category
    labels: [nature, urban, people]

Prend en charge 11 types d'affichage incluant text, html, image, video, audio, dialogue, pairwise, code, spreadsheet, document et pdf.

En savoir plus sur l'affichage des instances →

Annotation de segments multi-champs

Les schémas d'annotation de segments prennent désormais en charge une option target_field pour annoter sur plusieurs champs de texte dans la même instance.

yaml

annotation_schemes:
  - annotation_type: span
    name: source_entities
    target_field: "source_text"
    labels: [PERSON, ORGANIZATION]
 
  - annotation_type: span
    name: summary_entities
    target_field: "summary"
    labels: [PERSON, ORGANIZATION]

En savoir plus sur l'annotation de segments →

Liaison de segments

Un nouveau type d'annotation span_link pour créer des relations typées entre des segments annotés. Prend en charge les liens dirigés et non dirigés, les relations N-aires, l'affichage visuel en arc et les contraintes d'étiquettes.

yaml

annotation_schemes:
  - annotation_type: span
    name: entities
    labels:
      - name: "PERSON"
        color: "#3b82f6"
      - name: "ORGANIZATION"
        color: "#22c55e"
 
  - annotation_type: span_link
    name: relations
    span_schema: entities
    link_types:
      - name: "WORKS_FOR"
        directed: true
        allowed_source_labels: ["PERSON"]
        allowed_target_labels: ["ORGANIZATION"]
        color: "#dc2626"

En savoir plus sur la liaison de segments →

Support IA visuel

Quatre nouveaux points d'accès vision pour l'assistance IA à l'annotation d'images et de vidéos :

YOLO — Détection d'objets locale rapide
Ollama Vision — Modèles vision-langage locaux (LLaVA, Qwen-VL)
OpenAI Vision — Vision cloud GPT-4o
Anthropic Vision — Claude avec vision

Les fonctionnalités incluent la détection d'objets, la pré-annotation, la classification, les indices, la détection de scènes, la détection de trames clés et le suivi d'objets.

En savoir plus sur le support IA visuel →

Personnalisation de la mise en page

Créez des mises en page visuelles personnalisées sophistiquées en utilisant des templates HTML et du CSS. Potato génère un fichier de mise en page modifiable, ou vous pouvez fournir un template entièrement personnalisé avec des grilles, des options colorées et des styles de sections.

yaml

task_layout: layouts/custom_task_layout.html

Trois exemples de mise en page inclus : modération de contenu, QA de dialogue et revue médicale.

En savoir plus sur la personnalisation de la mise en page →

Justifications des étiquettes

Une quatrième capacité IA qui génère des explications équilibrées sur pourquoi chaque étiquette pourrait s'appliquer, aidant les annotateurs à comprendre les différentes perspectives de classification.

yaml

ai_support:
  features:
    rationales:
      enabled: true

En savoir plus sur le support IA →

Autres améliorations

Plus de 50 nouveaux tests pour une fiabilité améliorée
Améliorations du design responsive
Organisation améliorée du project-hub avec des exemples de mise en page
Corrections de bugs sur les types d'annotation

Comparaison v2.0 vs v2.1

Fonctionnalité	v2.0	v2.1
Affichage des instances	Via des hacks d'annotation	Bloc `instance_display` dédié
Cibles de segments	Champ de texte unique	Multi-champs avec `target_field`
Liaison de segments	Non disponible	Type `span_link` complet
IA visuelle	Non disponible	YOLO, Ollama Vision, OpenAI Vision, Anthropic Vision
Personnalisation de la mise en page	Auto-générée basique	Auto-générée + templates personnalisés
Capacités IA	3 (indices, mots-clés, suggestions)	4 (+ justifications)

Potato 2.0

Potato 2.0 est une version majeure qui introduit de nouvelles fonctionnalités puissantes pour une annotation intelligente et évolutive. Cette section met en lumière les principaux ajouts et améliorations.

Support IA

Intégrez des grands modèles de langage pour assister les annotateurs avec des indices intelligents, le surlignage de mots-clés et des suggestions d'étiquettes.

Fournisseurs supportés :

OpenAI (GPT-4, GPT-3.5)
Anthropic (Claude 3, Claude 3.5)
Google (Gemini)
Ollama (modèles locaux)
vLLM (auto-hébergé)

yaml

ai_support:
  enabled: true
  endpoint_type: openai
  ai_config:
    model: gpt-4
    api_key: ${OPENAI_API_KEY}
  features:
    hints:
      enabled: true
    label_suggestions:
      enabled: true

En savoir plus sur le support IA →

Annotation audio

Annotation audio complète avec visualisation de forme d'onde alimentée par Peaks.js. Créez des segments, étiquetez des régions temporelles et annotez la parole avec des raccourcis clavier.

Fonctionnalités clés :

Visualisation de forme d'onde
Création et étiquetage de segments
Questions d'annotation par segment
Plus de 15 raccourcis clavier
Mise en cache côté serveur des formes d'onde

yaml

annotation_schemes:
  - annotation_type: audio
    name: speakers
    mode: label
    labels:
      - Speaker A
      - Speaker B

En savoir plus sur l'annotation audio →

Apprentissage actif

Priorisez automatiquement les instances d'annotation en fonction de l'incertitude du modèle. Entraînez des classifieurs sur les annotations existantes et concentrez les annotateurs sur les exemples les plus informatifs.

Capacités :

Plusieurs options de classifieurs (LogisticRegression, RandomForest, SVC, MultinomialNB)
Divers vectoriseurs (TF-IDF, Count, Hashing)
Persistance du modèle entre les redémarrages
Sélection améliorée par LLM
Support multi-schémas

yaml

active_learning:
  enabled: true
  schema_names:
    - sentiment
  min_instances_for_training: 30
  update_frequency: 50
  classifier:
    type: LogisticRegression

En savoir plus sur l'apprentissage actif →

Phase d'entraînement

Qualifiez les annotateurs avec des questions d'entraînement avant la tâche principale. Fournissez un retour immédiat et assurez la qualité grâce à des critères de réussite configurables.

Fonctionnalités :

Questions d'entraînement avec réponses connues
Retour immédiat et explications
Critères de réussite configurables
Options de nouvelle tentative
Suivi de la progression dans le tableau de bord administrateur

yaml

phases:
  training:
    enabled: true
    data_file: "data/training.json"
    passing_criteria:
      min_correct: 8
      total_questions: 10

En savoir plus sur la phase d'entraînement →

Tableau de bord administrateur amélioré

Interface complète de suivi et de gestion des tâches d'annotation.

Onglets du tableau de bord :

Vue d'ensemble : Métriques de haut niveau et taux de complétion
Annotateurs : Suivi des performances, analyse des temps
Instances : Parcourir les données avec scores de désaccord
Configuration : Ajustement des paramètres en temps réel

yaml

admin_api_key: ${ADMIN_API_KEY}

En savoir plus sur le tableau de bord administrateur →

Backend de base de données

Support MySQL pour les déploiements à grande échelle avec pool de connexions et support transactionnel.

yaml

database:
  type: mysql
  host: localhost
  database: potato_db
  user: ${DB_USER}
  password: ${DB_PASSWORD}

Potato crée automatiquement les tables nécessaires au premier démarrage.

Historique d'annotation

Suivi complet de toutes les modifications d'annotation avec horodatages, identifiants utilisateur et types d'actions. Permet l'audit et l'analyse comportementale.

json

{
  "history": [
    {
      "timestamp": "2024-01-15T10:30:00Z",
      "user": "annotator_1",
      "action": "create",
      "schema": "sentiment",
      "value": "Positive"
    }
  ]
}

Flux de travail multi-phases

Construisez des flux de travail d'annotation complexes avec plusieurs phases séquentielles :

Consentement - Collecte du consentement éclairé
Pré-étude - Démographie et filtrage
Instructions - Consignes de la tâche
Entraînement - Questions d'entraînement
Annotation - Tâche principale
Post-étude - Enquêtes de retour

yaml

phases:
  consent:
    enabled: true
    data_file: "data/consent.json"
  prestudy:
    enabled: true
    data_file: "data/demographics.json"
  training:
    enabled: true
    data_file: "data/training.json"
  poststudy:
    enabled: true
    data_file: "data/feedback.json"

En savoir plus sur les flux de travail multi-phases →

Changements de configuration v2.0

Nouvelle structure de configuration

Potato 2.0 utilise un format de configuration plus propre :

v1 (ancien) :

yaml

data_files:
  - data.json
id_key: id
text_key: text
output_file: annotations.json

v2 (nouveau) :

yaml

data_files:
  - "data/data.json"
 
item_properties:
  id_key: id
  text_key: text
 
output_annotation_dir: "output/"
output_annotation_format: "json"

Exigence de sécurité

Les fichiers de configuration doivent désormais se trouver dans le task_dir :

yaml

# Valid - config.yaml is in the project directory
task_dir: "."
 
# Valid - config in configs/ subdirectory
task_dir: "my_project/"

Comparaison rapide

Fonctionnalité	v1	v2.0	v2.1	v2.2
Support IA/LLM	Non	Oui	Oui + IA visuelle + Justifications	+ Mise en évidence des options
Annotation audio	Basique	Forme d'onde complète	Forme d'onde complète	Forme d'onde complète
Apprentissage actif	Non	Oui	Oui	Oui + Ordonnancement par diversité
Affichage des instances	Non	Non	Oui	Oui
Liaison de segments	Non	Non	Oui	Oui
Annotation d'événements	Non	Non	Non	Oui
Liaison d'entités	Non	Non	Non	Oui
Pairwise/Triage/Coréférence/Arbres	Non	Non	Non	Oui
Personnalisation de la mise en page	Non	Auto-générée	Auto + Templates personnalisés	Auto + Templates personnalisés
Phase d'entraînement	Non	Oui	Oui	Oui
Tableau de bord admin	Basique	Amélioré	Amélioré	Amélioré + MACE
Backend base de données	Fichier uniquement	Fichier + MySQL	Fichier + MySQL	Fichier + MySQL
CLI d'exportation	Non	Non	Non	Oui (COCO, YOLO, CoNLL, etc.)
Instruments d'enquête	Non	Non	Non	55 questionnaires validés
Sources de données distantes	Non	Non	Non	S3, GDrive, HuggingFace, etc.

Guide de migration

Mise à jour de votre configuration (v1 vers v2)

Configuration des données

yaml

# Old
id_key: id
text_key: text
 
# New
item_properties:
  id_key: id
  text_key: text

Configuration de la sortie

yaml

# Old
output_file: annotations.json
 
# New
output_annotation_dir: "output/"
output_annotation_format: "json"

Emplacement du fichier de configuration Assurez-vous que votre fichier de configuration se trouve dans le répertoire du projet.

Démarrage du serveur

bash

# v2 command
python -m potato start config.yaml -p 8000
 
# Or shorthand
potato start config.yaml

Pour commencer

Prêt à essayer Potato ? Commencez avec le Guide de démarrage rapide ou explorez des fonctionnalités spécifiques :

Fonctionnalités v2.2 :

Annotation d'événements - Structures d'événements N-aires
Liaison d'entités - Liaison à des bases de connaissances
Triage - Filtrage rapide des données
Chaînes de coréférence - Coréférence d'entités
Arbres de conversation - Annotation de dialogues hiérarchiques
MACE - Estimation de la compétence des annotateurs
Mise en évidence des options - Guidage assisté par IA
Ordonnancement par diversité - Ordonnancement des éléments par embeddings
Formats d'exportation - CLI d'exportation avec 6 formats
Sources de données distantes - Chargement de données cloud
Instruments d'enquête - 55 questionnaires validés

Fonctionnalités v2.1 :

Affichage des instances - Affichage de contenu multi-modal
Support IA visuel - IA pour l'annotation d'images et de vidéos
Liaison de segments - Annotation de relations entre entités

Fonctionnalités principales :

Support IA - Assistance intelligente à l'annotation
Apprentissage actif - Priorisation intelligente des instances
Annotation audio - Annotation basée sur les formes d'onde
Phase d'entraînement - Qualification des annotateurs
Tableau de bord administrateur - Suivi et gestion