Nouveautés
Aperçu des nouvelles fonctionnalités et améliorations dans les versions Potato v2.x.
Nouveautés
Cette page couvre les nouvelles fonctionnalités et améliorations des versions Potato v2.x.
Potato 2.2.0
Publié le 20 février 2026
Potato 2.2 est une version majeure avec 9 nouveaux schémas d'annotation, un système d'exportation modulaire, l'estimation de compétence MACE, 55 instruments d'enquête validés et des sources de données distantes.
Nouveaux schémas d'annotation (9)
Annotation d'événements — Structures d'événements N-aires avec segments déclencheurs et rôles d'arguments typés. Annotez des événements comme ATTACK, HIRE et TRAVEL avec des arguments d'entités contraints et une visualisation en arc en étoile.
annotation_schemes:
- annotation_type: event_annotation
name: events
span_schema: entities
event_types:
- type: "ATTACK"
trigger_labels: ["EVENT_TRIGGER"]
arguments:
- role: "attacker"
entity_types: ["PERSON", "ORGANIZATION"]
required: trueEn savoir plus sur l'annotation d'événements →
Liaison d'entités — Liez les annotations de segments à des bases de connaissances externes (Wikidata, UMLS, API REST personnalisées). Ajoutez un bloc entity_linking: à tout schéma de segments pour activer la recherche et la liaison KB.
En savoir plus sur la liaison d'entités →
Triage — Interface d'acceptation/rejet/passage de type Prodigy pour le filtrage rapide des données. Étiquettes personnalisables, raccourcis clavier et avancement automatique pour une annotation à haut débit.
En savoir plus sur le triage →
Comparaison par paires — Comparez deux éléments en mode binaire (cliquez sur la tuile préférée) ou en mode échelle (curseur). Prend en charge items_key, allow_tie, bloc scale: avec plage configurable.
En savoir plus sur la comparaison par paires →
Arbres de conversation — Annotez des structures de conversation hiérarchiques avec des évaluations par nœud, la sélection de chemins et la comparaison de branches.
En savoir plus sur les arbres de conversation →
Chaînes de coréférence — Regroupez les mentions coréférentes dans des chaînes avec des indicateurs visuels. Prend en charge les types d'entités, le contrôle des singletons et plusieurs modes de surlignage.
En savoir plus sur les chaînes de coréférence →
Masques de segmentation — Nouveaux outils fill, eraser et brush pour la segmentation d'images au niveau pixel.
Boîtes englobantes pour PDF/Documents — Dessinez des boîtes sur les pages PDF pour les tâches d'annotation de documents.
Segments discontinus — allow_discontinuous: true permet de sélectionner des segments de texte non contigus comme un seul segment.
Annotation intelligente
Estimation de compétence MACE — Algorithme EM bayésien variationnel qui estime conjointement les vraies étiquettes et les scores de compétence des annotateurs (0.0-1.0). Fonctionne avec les schémas radio, likert, select et multiselect.
mace:
enabled: true
trigger_every_n: 10
min_annotations_per_item: 3Mise en évidence des options — Mise en évidence basée sur les LLM des options les plus probables pour les tâches d'annotation discrètes. Met en évidence les top-k options avec un indicateur étoile tout en atténuant les options moins probables.
ai_support:
option_highlighting:
enabled: true
top_k: 3
dim_opacity: 0.4En savoir plus sur la mise en évidence des options →
Ordonnancement par diversité — Clustering basé sur les embeddings et échantillonnage en tourniquet pour garantir que les annotateurs voient du contenu diversifié plutôt que des éléments similaires en séquence.
assignment_strategy: diversity_clustering
diversity_ordering:
enabled: true
prefill_count: 100En savoir plus sur l'ordonnancement par diversité →
Système d'exportation
Un nouveau CLI d'exportation modulaire (python -m potato.export) convertit les annotations en 6 formats standards de l'industrie : COCO, YOLO, Pascal VOC, CoNLL-2003, CoNLL-U et masques de segmentation.
python -m potato.export --config config.yaml --format coco --output ./export/En savoir plus sur les formats d'exportation →
Sources de données distantes
Chargez des données d'annotation depuis des URL, S3, Google Drive, Dropbox, Hugging Face, Google Sheets et des bases de données SQL via le nouveau bloc de configuration data_sources:. Inclut le chargement partiel, la mise en cache et la gestion des identifiants.
En savoir plus sur les sources de données distantes →
Instruments d'enquête
55 questionnaires validés répartis en 8 catégories (Personnalité, Santé mentale, Affect, Concept de soi, Attitudes sociales, Style de réponse, Format court, Démographie). Utilisez-les dans les phases pré-étude/post-étude avec instrument: "tipi".
En savoir plus sur les instruments d'enquête →
Autres améliorations
- Suivi d'objets vidéo avec interpolation de trames clés
- Support de fichiers de configuration IA externes
- Améliorations de la grille de mise en page des formulaires
- Gestionnaires de formats pour PDF, Word, code et tableurs
Potato 2.1.0
Publié le 5 février 2026
Potato 2.1 introduit le système d'affichage des instances, le support IA visuel, la liaison de segments, l'annotation de segments multi-champs et la personnalisation de la mise en page.
Système d'affichage des instances
Un nouveau bloc de configuration instance_display qui sépare l'affichage du contenu de l'annotation. Affichez toute combinaison d'images, vidéos, audio, texte et dialogues aux côtés de tout schéma d'annotation.
instance_display:
fields:
- key: image_url
type: image
display_options:
max_width: 600
zoomable: true
- key: description
type: text
annotation_schemes:
- annotation_type: radio
name: category
labels: [nature, urban, people]Prend en charge 11 types d'affichage incluant text, html, image, video, audio, dialogue, pairwise, code, spreadsheet, document et pdf.
En savoir plus sur l'affichage des instances →
Annotation de segments multi-champs
Les schémas d'annotation de segments prennent désormais en charge une option target_field pour annoter sur plusieurs champs de texte dans la même instance.
annotation_schemes:
- annotation_type: span
name: source_entities
target_field: "source_text"
labels: [PERSON, ORGANIZATION]
- annotation_type: span
name: summary_entities
target_field: "summary"
labels: [PERSON, ORGANIZATION]En savoir plus sur l'annotation de segments →
Liaison de segments
Un nouveau type d'annotation span_link pour créer des relations typées entre des segments annotés. Prend en charge les liens dirigés et non dirigés, les relations N-aires, l'affichage visuel en arc et les contraintes d'étiquettes.
annotation_schemes:
- annotation_type: span
name: entities
labels:
- name: "PERSON"
color: "#3b82f6"
- name: "ORGANIZATION"
color: "#22c55e"
- annotation_type: span_link
name: relations
span_schema: entities
link_types:
- name: "WORKS_FOR"
directed: true
allowed_source_labels: ["PERSON"]
allowed_target_labels: ["ORGANIZATION"]
color: "#dc2626"En savoir plus sur la liaison de segments →
Support IA visuel
Quatre nouveaux points d'accès vision pour l'assistance IA à l'annotation d'images et de vidéos :
- YOLO — Détection d'objets locale rapide
- Ollama Vision — Modèles vision-langage locaux (LLaVA, Qwen-VL)
- OpenAI Vision — Vision cloud GPT-4o
- Anthropic Vision — Claude avec vision
Les fonctionnalités incluent la détection d'objets, la pré-annotation, la classification, les indices, la détection de scènes, la détection de trames clés et le suivi d'objets.
En savoir plus sur le support IA visuel →
Personnalisation de la mise en page
Créez des mises en page visuelles personnalisées sophistiquées en utilisant des templates HTML et du CSS. Potato génère un fichier de mise en page modifiable, ou vous pouvez fournir un template entièrement personnalisé avec des grilles, des options colorées et des styles de sections.
task_layout: layouts/custom_task_layout.htmlTrois exemples de mise en page inclus : modération de contenu, QA de dialogue et revue médicale.
En savoir plus sur la personnalisation de la mise en page →
Justifications des étiquettes
Une quatrième capacité IA qui génère des explications équilibrées sur pourquoi chaque étiquette pourrait s'appliquer, aidant les annotateurs à comprendre les différentes perspectives de classification.
ai_support:
features:
rationales:
enabled: trueEn savoir plus sur le support IA →
Autres améliorations
- Plus de 50 nouveaux tests pour une fiabilité améliorée
- Améliorations du design responsive
- Organisation améliorée du project-hub avec des exemples de mise en page
- Corrections de bugs sur les types d'annotation
Comparaison v2.0 vs v2.1
| Fonctionnalité | v2.0 | v2.1 |
|---|---|---|
| Affichage des instances | Via des hacks d'annotation | Bloc instance_display dédié |
| Cibles de segments | Champ de texte unique | Multi-champs avec target_field |
| Liaison de segments | Non disponible | Type span_link complet |
| IA visuelle | Non disponible | YOLO, Ollama Vision, OpenAI Vision, Anthropic Vision |
| Personnalisation de la mise en page | Auto-générée basique | Auto-générée + templates personnalisés |
| Capacités IA | 3 (indices, mots-clés, suggestions) | 4 (+ justifications) |
Potato 2.0
Potato 2.0 est une version majeure qui introduit de nouvelles fonctionnalités puissantes pour une annotation intelligente et évolutive. Cette section met en lumière les principaux ajouts et améliorations.
Support IA
Intégrez des grands modèles de langage pour assister les annotateurs avec des indices intelligents, le surlignage de mots-clés et des suggestions d'étiquettes.
Fournisseurs supportés :
- OpenAI (GPT-4, GPT-3.5)
- Anthropic (Claude 3, Claude 3.5)
- Google (Gemini)
- Ollama (modèles locaux)
- vLLM (auto-hébergé)
ai_support:
enabled: true
endpoint_type: openai
ai_config:
model: gpt-4
api_key: ${OPENAI_API_KEY}
features:
hints:
enabled: true
label_suggestions:
enabled: trueEn savoir plus sur le support IA →
Annotation audio
Annotation audio complète avec visualisation de forme d'onde alimentée par Peaks.js. Créez des segments, étiquetez des régions temporelles et annotez la parole avec des raccourcis clavier.
Fonctionnalités clés :
- Visualisation de forme d'onde
- Création et étiquetage de segments
- Questions d'annotation par segment
- Plus de 15 raccourcis clavier
- Mise en cache côté serveur des formes d'onde
annotation_schemes:
- annotation_type: audio
name: speakers
mode: label
labels:
- Speaker A
- Speaker BEn savoir plus sur l'annotation audio →
Apprentissage actif
Priorisez automatiquement les instances d'annotation en fonction de l'incertitude du modèle. Entraînez des classifieurs sur les annotations existantes et concentrez les annotateurs sur les exemples les plus informatifs.
Capacités :
- Plusieurs options de classifieurs (LogisticRegression, RandomForest, SVC, MultinomialNB)
- Divers vectoriseurs (TF-IDF, Count, Hashing)
- Persistance du modèle entre les redémarrages
- Sélection améliorée par LLM
- Support multi-schémas
active_learning:
enabled: true
schema_names:
- sentiment
min_instances_for_training: 30
update_frequency: 50
classifier:
type: LogisticRegressionEn savoir plus sur l'apprentissage actif →
Phase d'entraînement
Qualifiez les annotateurs avec des questions d'entraînement avant la tâche principale. Fournissez un retour immédiat et assurez la qualité grâce à des critères de réussite configurables.
Fonctionnalités :
- Questions d'entraînement avec réponses connues
- Retour immédiat et explications
- Critères de réussite configurables
- Options de nouvelle tentative
- Suivi de la progression dans le tableau de bord administrateur
phases:
training:
enabled: true
data_file: "data/training.json"
passing_criteria:
min_correct: 8
total_questions: 10En savoir plus sur la phase d'entraînement →
Tableau de bord administrateur amélioré
Interface complète de suivi et de gestion des tâches d'annotation.
Onglets du tableau de bord :
- Vue d'ensemble : Métriques de haut niveau et taux de complétion
- Annotateurs : Suivi des performances, analyse des temps
- Instances : Parcourir les données avec scores de désaccord
- Configuration : Ajustement des paramètres en temps réel
admin_api_key: ${ADMIN_API_KEY}En savoir plus sur le tableau de bord administrateur →
Backend de base de données
Support MySQL pour les déploiements à grande échelle avec pool de connexions et support transactionnel.
database:
type: mysql
host: localhost
database: potato_db
user: ${DB_USER}
password: ${DB_PASSWORD}Potato crée automatiquement les tables nécessaires au premier démarrage.
Historique d'annotation
Suivi complet de toutes les modifications d'annotation avec horodatages, identifiants utilisateur et types d'actions. Permet l'audit et l'analyse comportementale.
{
"history": [
{
"timestamp": "2024-01-15T10:30:00Z",
"user": "annotator_1",
"action": "create",
"schema": "sentiment",
"value": "Positive"
}
]
}Flux de travail multi-phases
Construisez des flux de travail d'annotation complexes avec plusieurs phases séquentielles :
- Consentement - Collecte du consentement éclairé
- Pré-étude - Démographie et filtrage
- Instructions - Consignes de la tâche
- Entraînement - Questions d'entraînement
- Annotation - Tâche principale
- Post-étude - Enquêtes de retour
phases:
consent:
enabled: true
data_file: "data/consent.json"
prestudy:
enabled: true
data_file: "data/demographics.json"
training:
enabled: true
data_file: "data/training.json"
poststudy:
enabled: true
data_file: "data/feedback.json"En savoir plus sur les flux de travail multi-phases →
Changements de configuration v2.0
Nouvelle structure de configuration
Potato 2.0 utilise un format de configuration plus propre :
v1 (ancien) :
data_files:
- data.json
id_key: id
text_key: text
output_file: annotations.jsonv2 (nouveau) :
data_files:
- "data/data.json"
item_properties:
id_key: id
text_key: text
output_annotation_dir: "output/"
output_annotation_format: "json"Exigence de sécurité
Les fichiers de configuration doivent désormais se trouver dans le task_dir :
# Valid - config.yaml is in the project directory
task_dir: "."
# Valid - config in configs/ subdirectory
task_dir: "my_project/"Comparaison rapide
| Fonctionnalité | v1 | v2.0 | v2.1 | v2.2 |
|---|---|---|---|---|
| Support IA/LLM | Non | Oui | Oui + IA visuelle + Justifications | + Mise en évidence des options |
| Annotation audio | Basique | Forme d'onde complète | Forme d'onde complète | Forme d'onde complète |
| Apprentissage actif | Non | Oui | Oui | Oui + Ordonnancement par diversité |
| Affichage des instances | Non | Non | Oui | Oui |
| Liaison de segments | Non | Non | Oui | Oui |
| Annotation d'événements | Non | Non | Non | Oui |
| Liaison d'entités | Non | Non | Non | Oui |
| Pairwise/Triage/Coréférence/Arbres | Non | Non | Non | Oui |
| Personnalisation de la mise en page | Non | Auto-générée | Auto + Templates personnalisés | Auto + Templates personnalisés |
| Phase d'entraînement | Non | Oui | Oui | Oui |
| Tableau de bord admin | Basique | Amélioré | Amélioré | Amélioré + MACE |
| Backend base de données | Fichier uniquement | Fichier + MySQL | Fichier + MySQL | Fichier + MySQL |
| CLI d'exportation | Non | Non | Non | Oui (COCO, YOLO, CoNLL, etc.) |
| Instruments d'enquête | Non | Non | Non | 55 questionnaires validés |
| Sources de données distantes | Non | Non | Non | S3, GDrive, HuggingFace, etc. |
Guide de migration
Mise à jour de votre configuration (v1 vers v2)
-
Configuration des données
yaml# Old id_key: id text_key: text # New item_properties: id_key: id text_key: text -
Configuration de la sortie
yaml# Old output_file: annotations.json # New output_annotation_dir: "output/" output_annotation_format: "json" -
Emplacement du fichier de configuration Assurez-vous que votre fichier de configuration se trouve dans le répertoire du projet.
Démarrage du serveur
# v2 command
python -m potato start config.yaml -p 8000
# Or shorthand
potato start config.yamlPour commencer
Prêt à essayer Potato ? Commencez avec le Guide de démarrage rapide ou explorez des fonctionnalités spécifiques :
Fonctionnalités v2.2 :
- Annotation d'événements - Structures d'événements N-aires
- Liaison d'entités - Liaison à des bases de connaissances
- Triage - Filtrage rapide des données
- Chaînes de coréférence - Coréférence d'entités
- Arbres de conversation - Annotation de dialogues hiérarchiques
- MACE - Estimation de la compétence des annotateurs
- Mise en évidence des options - Guidage assisté par IA
- Ordonnancement par diversité - Ordonnancement des éléments par embeddings
- Formats d'exportation - CLI d'exportation avec 6 formats
- Sources de données distantes - Chargement de données cloud
- Instruments d'enquête - 55 questionnaires validés
Fonctionnalités v2.1 :
- Affichage des instances - Affichage de contenu multi-modal
- Support IA visuel - IA pour l'annotation d'images et de vidéos
- Liaison de segments - Annotation de relations entre entités
Fonctionnalités principales :
- Support IA - Assistance intelligente à l'annotation
- Apprentissage actif - Priorisation intelligente des instances
- Annotation audio - Annotation basée sur les formes d'onde
- Phase d'entraînement - Qualification des annotateurs
- Tableau de bord administrateur - Suivi et gestion