Skip to content

Nouveautés

Aperçu des nouvelles fonctionnalités et améliorations dans les versions Potato v2.x.

Nouveautés

Cette page couvre les nouvelles fonctionnalités et améliorations des versions Potato v2.x.


Potato 2.2.0

Publié le 20 février 2026

Potato 2.2 est une version majeure avec 9 nouveaux schémas d'annotation, un système d'exportation modulaire, l'estimation de compétence MACE, 55 instruments d'enquête validés et des sources de données distantes.

Nouveaux schémas d'annotation (9)

Annotation d'événements — Structures d'événements N-aires avec segments déclencheurs et rôles d'arguments typés. Annotez des événements comme ATTACK, HIRE et TRAVEL avec des arguments d'entités contraints et une visualisation en arc en étoile.

yaml
annotation_schemes:
  - annotation_type: event_annotation
    name: events
    span_schema: entities
    event_types:
      - type: "ATTACK"
        trigger_labels: ["EVENT_TRIGGER"]
        arguments:
          - role: "attacker"
            entity_types: ["PERSON", "ORGANIZATION"]
            required: true

En savoir plus sur l'annotation d'événements →

Liaison d'entités — Liez les annotations de segments à des bases de connaissances externes (Wikidata, UMLS, API REST personnalisées). Ajoutez un bloc entity_linking: à tout schéma de segments pour activer la recherche et la liaison KB.

En savoir plus sur la liaison d'entités →

Triage — Interface d'acceptation/rejet/passage de type Prodigy pour le filtrage rapide des données. Étiquettes personnalisables, raccourcis clavier et avancement automatique pour une annotation à haut débit.

En savoir plus sur le triage →

Comparaison par paires — Comparez deux éléments en mode binaire (cliquez sur la tuile préférée) ou en mode échelle (curseur). Prend en charge items_key, allow_tie, bloc scale: avec plage configurable.

En savoir plus sur la comparaison par paires →

Arbres de conversation — Annotez des structures de conversation hiérarchiques avec des évaluations par nœud, la sélection de chemins et la comparaison de branches.

En savoir plus sur les arbres de conversation →

Chaînes de coréférence — Regroupez les mentions coréférentes dans des chaînes avec des indicateurs visuels. Prend en charge les types d'entités, le contrôle des singletons et plusieurs modes de surlignage.

En savoir plus sur les chaînes de coréférence →

Masques de segmentation — Nouveaux outils fill, eraser et brush pour la segmentation d'images au niveau pixel.

Boîtes englobantes pour PDF/Documents — Dessinez des boîtes sur les pages PDF pour les tâches d'annotation de documents.

Segments discontinusallow_discontinuous: true permet de sélectionner des segments de texte non contigus comme un seul segment.


Annotation intelligente

Estimation de compétence MACE — Algorithme EM bayésien variationnel qui estime conjointement les vraies étiquettes et les scores de compétence des annotateurs (0.0-1.0). Fonctionne avec les schémas radio, likert, select et multiselect.

yaml
mace:
  enabled: true
  trigger_every_n: 10
  min_annotations_per_item: 3

En savoir plus sur MACE →

Mise en évidence des options — Mise en évidence basée sur les LLM des options les plus probables pour les tâches d'annotation discrètes. Met en évidence les top-k options avec un indicateur étoile tout en atténuant les options moins probables.

yaml
ai_support:
  option_highlighting:
    enabled: true
    top_k: 3
    dim_opacity: 0.4

En savoir plus sur la mise en évidence des options →

Ordonnancement par diversité — Clustering basé sur les embeddings et échantillonnage en tourniquet pour garantir que les annotateurs voient du contenu diversifié plutôt que des éléments similaires en séquence.

yaml
assignment_strategy: diversity_clustering
diversity_ordering:
  enabled: true
  prefill_count: 100

En savoir plus sur l'ordonnancement par diversité →


Système d'exportation

Un nouveau CLI d'exportation modulaire (python -m potato.export) convertit les annotations en 6 formats standards de l'industrie : COCO, YOLO, Pascal VOC, CoNLL-2003, CoNLL-U et masques de segmentation.

bash
python -m potato.export --config config.yaml --format coco --output ./export/

En savoir plus sur les formats d'exportation →


Sources de données distantes

Chargez des données d'annotation depuis des URL, S3, Google Drive, Dropbox, Hugging Face, Google Sheets et des bases de données SQL via le nouveau bloc de configuration data_sources:. Inclut le chargement partiel, la mise en cache et la gestion des identifiants.

En savoir plus sur les sources de données distantes →


Instruments d'enquête

55 questionnaires validés répartis en 8 catégories (Personnalité, Santé mentale, Affect, Concept de soi, Attitudes sociales, Style de réponse, Format court, Démographie). Utilisez-les dans les phases pré-étude/post-étude avec instrument: "tipi".

En savoir plus sur les instruments d'enquête →


Autres améliorations

  • Suivi d'objets vidéo avec interpolation de trames clés
  • Support de fichiers de configuration IA externes
  • Améliorations de la grille de mise en page des formulaires
  • Gestionnaires de formats pour PDF, Word, code et tableurs

Potato 2.1.0

Publié le 5 février 2026

Potato 2.1 introduit le système d'affichage des instances, le support IA visuel, la liaison de segments, l'annotation de segments multi-champs et la personnalisation de la mise en page.

Système d'affichage des instances

Un nouveau bloc de configuration instance_display qui sépare l'affichage du contenu de l'annotation. Affichez toute combinaison d'images, vidéos, audio, texte et dialogues aux côtés de tout schéma d'annotation.

yaml
instance_display:
  fields:
    - key: image_url
      type: image
      display_options:
        max_width: 600
        zoomable: true
    - key: description
      type: text
 
annotation_schemes:
  - annotation_type: radio
    name: category
    labels: [nature, urban, people]

Prend en charge 11 types d'affichage incluant text, html, image, video, audio, dialogue, pairwise, code, spreadsheet, document et pdf.

En savoir plus sur l'affichage des instances →


Annotation de segments multi-champs

Les schémas d'annotation de segments prennent désormais en charge une option target_field pour annoter sur plusieurs champs de texte dans la même instance.

yaml
annotation_schemes:
  - annotation_type: span
    name: source_entities
    target_field: "source_text"
    labels: [PERSON, ORGANIZATION]
 
  - annotation_type: span
    name: summary_entities
    target_field: "summary"
    labels: [PERSON, ORGANIZATION]

En savoir plus sur l'annotation de segments →


Liaison de segments

Un nouveau type d'annotation span_link pour créer des relations typées entre des segments annotés. Prend en charge les liens dirigés et non dirigés, les relations N-aires, l'affichage visuel en arc et les contraintes d'étiquettes.

yaml
annotation_schemes:
  - annotation_type: span
    name: entities
    labels:
      - name: "PERSON"
        color: "#3b82f6"
      - name: "ORGANIZATION"
        color: "#22c55e"
 
  - annotation_type: span_link
    name: relations
    span_schema: entities
    link_types:
      - name: "WORKS_FOR"
        directed: true
        allowed_source_labels: ["PERSON"]
        allowed_target_labels: ["ORGANIZATION"]
        color: "#dc2626"

En savoir plus sur la liaison de segments →


Support IA visuel

Quatre nouveaux points d'accès vision pour l'assistance IA à l'annotation d'images et de vidéos :

  • YOLO — Détection d'objets locale rapide
  • Ollama Vision — Modèles vision-langage locaux (LLaVA, Qwen-VL)
  • OpenAI Vision — Vision cloud GPT-4o
  • Anthropic Vision — Claude avec vision

Les fonctionnalités incluent la détection d'objets, la pré-annotation, la classification, les indices, la détection de scènes, la détection de trames clés et le suivi d'objets.

En savoir plus sur le support IA visuel →


Personnalisation de la mise en page

Créez des mises en page visuelles personnalisées sophistiquées en utilisant des templates HTML et du CSS. Potato génère un fichier de mise en page modifiable, ou vous pouvez fournir un template entièrement personnalisé avec des grilles, des options colorées et des styles de sections.

yaml
task_layout: layouts/custom_task_layout.html

Trois exemples de mise en page inclus : modération de contenu, QA de dialogue et revue médicale.

En savoir plus sur la personnalisation de la mise en page →


Justifications des étiquettes

Une quatrième capacité IA qui génère des explications équilibrées sur pourquoi chaque étiquette pourrait s'appliquer, aidant les annotateurs à comprendre les différentes perspectives de classification.

yaml
ai_support:
  features:
    rationales:
      enabled: true

En savoir plus sur le support IA →


Autres améliorations

  • Plus de 50 nouveaux tests pour une fiabilité améliorée
  • Améliorations du design responsive
  • Organisation améliorée du project-hub avec des exemples de mise en page
  • Corrections de bugs sur les types d'annotation

Comparaison v2.0 vs v2.1

Fonctionnalitév2.0v2.1
Affichage des instancesVia des hacks d'annotationBloc instance_display dédié
Cibles de segmentsChamp de texte uniqueMulti-champs avec target_field
Liaison de segmentsNon disponibleType span_link complet
IA visuelleNon disponibleYOLO, Ollama Vision, OpenAI Vision, Anthropic Vision
Personnalisation de la mise en pageAuto-générée basiqueAuto-générée + templates personnalisés
Capacités IA3 (indices, mots-clés, suggestions)4 (+ justifications)

Potato 2.0

Potato 2.0 est une version majeure qui introduit de nouvelles fonctionnalités puissantes pour une annotation intelligente et évolutive. Cette section met en lumière les principaux ajouts et améliorations.

Support IA

Intégrez des grands modèles de langage pour assister les annotateurs avec des indices intelligents, le surlignage de mots-clés et des suggestions d'étiquettes.

Fournisseurs supportés :

  • OpenAI (GPT-4, GPT-3.5)
  • Anthropic (Claude 3, Claude 3.5)
  • Google (Gemini)
  • Ollama (modèles locaux)
  • vLLM (auto-hébergé)
yaml
ai_support:
  enabled: true
  endpoint_type: openai
  ai_config:
    model: gpt-4
    api_key: ${OPENAI_API_KEY}
  features:
    hints:
      enabled: true
    label_suggestions:
      enabled: true

En savoir plus sur le support IA →


Annotation audio

Annotation audio complète avec visualisation de forme d'onde alimentée par Peaks.js. Créez des segments, étiquetez des régions temporelles et annotez la parole avec des raccourcis clavier.

Fonctionnalités clés :

  • Visualisation de forme d'onde
  • Création et étiquetage de segments
  • Questions d'annotation par segment
  • Plus de 15 raccourcis clavier
  • Mise en cache côté serveur des formes d'onde
yaml
annotation_schemes:
  - annotation_type: audio
    name: speakers
    mode: label
    labels:
      - Speaker A
      - Speaker B

En savoir plus sur l'annotation audio →


Apprentissage actif

Priorisez automatiquement les instances d'annotation en fonction de l'incertitude du modèle. Entraînez des classifieurs sur les annotations existantes et concentrez les annotateurs sur les exemples les plus informatifs.

Capacités :

  • Plusieurs options de classifieurs (LogisticRegression, RandomForest, SVC, MultinomialNB)
  • Divers vectoriseurs (TF-IDF, Count, Hashing)
  • Persistance du modèle entre les redémarrages
  • Sélection améliorée par LLM
  • Support multi-schémas
yaml
active_learning:
  enabled: true
  schema_names:
    - sentiment
  min_instances_for_training: 30
  update_frequency: 50
  classifier:
    type: LogisticRegression

En savoir plus sur l'apprentissage actif →


Phase d'entraînement

Qualifiez les annotateurs avec des questions d'entraînement avant la tâche principale. Fournissez un retour immédiat et assurez la qualité grâce à des critères de réussite configurables.

Fonctionnalités :

  • Questions d'entraînement avec réponses connues
  • Retour immédiat et explications
  • Critères de réussite configurables
  • Options de nouvelle tentative
  • Suivi de la progression dans le tableau de bord administrateur
yaml
phases:
  training:
    enabled: true
    data_file: "data/training.json"
    passing_criteria:
      min_correct: 8
      total_questions: 10

En savoir plus sur la phase d'entraînement →


Tableau de bord administrateur amélioré

Interface complète de suivi et de gestion des tâches d'annotation.

Onglets du tableau de bord :

  • Vue d'ensemble : Métriques de haut niveau et taux de complétion
  • Annotateurs : Suivi des performances, analyse des temps
  • Instances : Parcourir les données avec scores de désaccord
  • Configuration : Ajustement des paramètres en temps réel
yaml
admin_api_key: ${ADMIN_API_KEY}

En savoir plus sur le tableau de bord administrateur →


Backend de base de données

Support MySQL pour les déploiements à grande échelle avec pool de connexions et support transactionnel.

yaml
database:
  type: mysql
  host: localhost
  database: potato_db
  user: ${DB_USER}
  password: ${DB_PASSWORD}

Potato crée automatiquement les tables nécessaires au premier démarrage.


Historique d'annotation

Suivi complet de toutes les modifications d'annotation avec horodatages, identifiants utilisateur et types d'actions. Permet l'audit et l'analyse comportementale.

json
{
  "history": [
    {
      "timestamp": "2024-01-15T10:30:00Z",
      "user": "annotator_1",
      "action": "create",
      "schema": "sentiment",
      "value": "Positive"
    }
  ]
}

Flux de travail multi-phases

Construisez des flux de travail d'annotation complexes avec plusieurs phases séquentielles :

  1. Consentement - Collecte du consentement éclairé
  2. Pré-étude - Démographie et filtrage
  3. Instructions - Consignes de la tâche
  4. Entraînement - Questions d'entraînement
  5. Annotation - Tâche principale
  6. Post-étude - Enquêtes de retour
yaml
phases:
  consent:
    enabled: true
    data_file: "data/consent.json"
  prestudy:
    enabled: true
    data_file: "data/demographics.json"
  training:
    enabled: true
    data_file: "data/training.json"
  poststudy:
    enabled: true
    data_file: "data/feedback.json"

En savoir plus sur les flux de travail multi-phases →


Changements de configuration v2.0

Nouvelle structure de configuration

Potato 2.0 utilise un format de configuration plus propre :

v1 (ancien) :

yaml
data_files:
  - data.json
id_key: id
text_key: text
output_file: annotations.json

v2 (nouveau) :

yaml
data_files:
  - "data/data.json"
 
item_properties:
  id_key: id
  text_key: text
 
output_annotation_dir: "output/"
output_annotation_format: "json"

Exigence de sécurité

Les fichiers de configuration doivent désormais se trouver dans le task_dir :

yaml
# Valid - config.yaml is in the project directory
task_dir: "."
 
# Valid - config in configs/ subdirectory
task_dir: "my_project/"

Comparaison rapide

Fonctionnalitév1v2.0v2.1v2.2
Support IA/LLMNonOuiOui + IA visuelle + Justifications+ Mise en évidence des options
Annotation audioBasiqueForme d'onde complèteForme d'onde complèteForme d'onde complète
Apprentissage actifNonOuiOuiOui + Ordonnancement par diversité
Affichage des instancesNonNonOuiOui
Liaison de segmentsNonNonOuiOui
Annotation d'événementsNonNonNonOui
Liaison d'entitésNonNonNonOui
Pairwise/Triage/Coréférence/ArbresNonNonNonOui
Personnalisation de la mise en pageNonAuto-généréeAuto + Templates personnalisésAuto + Templates personnalisés
Phase d'entraînementNonOuiOuiOui
Tableau de bord adminBasiqueAmélioréAmélioréAmélioré + MACE
Backend base de donnéesFichier uniquementFichier + MySQLFichier + MySQLFichier + MySQL
CLI d'exportationNonNonNonOui (COCO, YOLO, CoNLL, etc.)
Instruments d'enquêteNonNonNon55 questionnaires validés
Sources de données distantesNonNonNonS3, GDrive, HuggingFace, etc.

Guide de migration

Mise à jour de votre configuration (v1 vers v2)

  1. Configuration des données

    yaml
    # Old
    id_key: id
    text_key: text
     
    # New
    item_properties:
      id_key: id
      text_key: text
  2. Configuration de la sortie

    yaml
    # Old
    output_file: annotations.json
     
    # New
    output_annotation_dir: "output/"
    output_annotation_format: "json"
  3. Emplacement du fichier de configuration Assurez-vous que votre fichier de configuration se trouve dans le répertoire du projet.

Démarrage du serveur

bash
# v2 command
python -m potato start config.yaml -p 8000
 
# Or shorthand
potato start config.yaml

Pour commencer

Prêt à essayer Potato ? Commencez avec le Guide de démarrage rapide ou explorez des fonctionnalités spécifiques :

Fonctionnalités v2.2 :

Fonctionnalités v2.1 :

Fonctionnalités principales :