Skip to content

Novedades

Resumen de nuevas funcionalidades y mejoras en las versiones Potato v2.x.

Novedades

Esta página cubre las nuevas funcionalidades y mejoras en las versiones Potato v2.x.


Potato 2.2.0

Publicado el 20 de febrero de 2026

Potato 2.2 es una versión mayor con 9 nuevos esquemas de anotación, un sistema de exportación modular, estimación de competencia MACE, 55 instrumentos de encuesta validados y fuentes de datos remotas.

Nuevos Esquemas de Anotación (9)

Anotación de Eventos — Estructuras de eventos N-arios con segmentos de activación y roles de argumento tipados. Anota eventos como ATTACK, HIRE y TRAVEL con argumentos de entidades restringidos y visualización de arcos hub-spoke.

yaml
annotation_schemes:
  - annotation_type: event_annotation
    name: events
    span_schema: entities
    event_types:
      - type: "ATTACK"
        trigger_labels: ["EVENT_TRIGGER"]
        arguments:
          - role: "attacker"
            entity_types: ["PERSON", "ORGANIZATION"]
            required: true

Más información sobre Anotación de Eventos →

Vinculación de Entidades — Vincula anotaciones de segmentos a bases de conocimiento externas (Wikidata, UMLS, APIs REST personalizadas). Añade un bloque entity_linking: a cualquier esquema de segmentos para habilitar la búsqueda y vinculación a bases de conocimiento.

Más información sobre Vinculación de Entidades →

Triaje — Interfaz de aceptar/rechazar/omitir al estilo Prodigy para la revisión rápida de datos. Etiquetas personalizables, atajos de teclado y avance automático para anotación de alto rendimiento.

Más información sobre Triaje →

Comparación por Pares — Compara dos elementos con modos binario (clic en el mosaico preferido) o de escala (deslizador). Soporta items_key, allow_tie, bloque scale: con rango configurable.

Más información sobre Comparación por Pares →

Árboles de Conversación — Anota estructuras de conversación jerárquicas con calificaciones por nodo, selección de caminos y comparación de ramas.

Más información sobre Árboles de Conversación →

Cadenas de Correferencia — Agrupa menciones de texto correferentes en cadenas con indicadores visuales. Soporta tipos de entidad, control de elementos individuales y múltiples modos de resaltado.

Más información sobre Cadenas de Correferencia →

Máscaras de Segmentación — Nuevas herramientas fill, eraser y brush para segmentación de imágenes a nivel de píxel.

Cuadros Delimitadores para PDF/Documentos — Dibuja cuadros en páginas PDF para tareas de anotación de documentos.

Segmentos Discontinuosallow_discontinuous: true permite seleccionar segmentos de texto no contiguos como un solo segmento.


Anotación Inteligente

Estimación de Competencia MACE — Algoritmo EM de Bayes variacional que estima conjuntamente las etiquetas verdaderas y las puntuaciones de competencia de los anotadores (0.0-1.0). Funciona con esquemas radio, likert, select y multiselect.

yaml
mace:
  enabled: true
  trigger_every_n: 10
  min_annotations_per_item: 3

Más información sobre MACE →

Resaltado de Opciones — Resaltado basado en LLM de las opciones probablemente correctas para tareas de anotación discretas. Resalta las top-k opciones con un indicador de estrella mientras atenúa las opciones menos probables.

yaml
ai_support:
  option_highlighting:
    enabled: true
    top_k: 3
    dim_opacity: 0.4

Más información sobre Resaltado de Opciones →

Ordenamiento por Diversidad — Agrupamiento basado en embeddings y muestreo round-robin para asegurar que los anotadores vean contenido diverso en lugar de elementos similares en secuencia.

yaml
assignment_strategy: diversity_clustering
diversity_ordering:
  enabled: true
  prefill_count: 100

Más información sobre Ordenamiento por Diversidad →


Sistema de Exportación

Un nuevo CLI de exportación modular (python -m potato.export) convierte anotaciones a 6 formatos estándar de la industria: COCO, YOLO, Pascal VOC, CoNLL-2003, CoNLL-U y Máscaras de Segmentación.

bash
python -m potato.export --config config.yaml --format coco --output ./export/

Más información sobre Formatos de Exportación →


Fuentes de Datos Remotas

Carga datos de anotación desde URLs, S3, Google Drive, Dropbox, Hugging Face, Google Sheets y bases de datos SQL mediante el nuevo bloque de configuración data_sources:. Incluye carga parcial, caché y gestión de credenciales.

Más información sobre Fuentes de Datos Remotas →


Instrumentos de Encuesta

55 cuestionarios validados en 8 categorías (Personalidad, Salud Mental, Afecto, Autoconcepto, Actitudes Sociales, Estilo de Respuesta, Formularios Cortos, Demografía). Úsalos en fases de pre-estudio/post-estudio con instrument: "tipi".

Más información sobre Instrumentos de Encuesta →


Otras Mejoras

  • Seguimiento de objetos en video con interpolación de fotogramas clave
  • Soporte de archivo de configuración de IA externo
  • Mejoras en la cuadrícula de diseño de formularios
  • Manejadores de formato para PDF, Word, código y hojas de cálculo

Potato 2.1.0

Publicado el 5 de febrero de 2026

Potato 2.1 introduce el sistema de visualización de instancias, soporte visual de IA, vinculación de segmentos, anotación de segmentos multi-campo y personalización de diseño.

Sistema de Visualización de Instancias

Un nuevo bloque de configuración instance_display que separa la visualización del contenido de la anotación. Muestra cualquier combinación de imágenes, videos, audio, texto y diálogos junto con cualquier esquema de anotación.

yaml
instance_display:
  fields:
    - key: image_url
      type: image
      display_options:
        max_width: 600
        zoomable: true
    - key: description
      type: text
 
annotation_schemes:
  - annotation_type: radio
    name: category
    labels: [nature, urban, people]

Soporta 11 tipos de visualización incluyendo text, html, image, video, audio, dialogue, pairwise, code, spreadsheet, document y pdf.

Más información sobre Visualización de Instancias →


Anotación de Segmentos Multi-Campo

Los esquemas de anotación de segmentos ahora soportan una opción target_field para anotar múltiples campos de texto en la misma instancia.

yaml
annotation_schemes:
  - annotation_type: span
    name: source_entities
    target_field: "source_text"
    labels: [PERSON, ORGANIZATION]
 
  - annotation_type: span
    name: summary_entities
    target_field: "summary"
    labels: [PERSON, ORGANIZATION]

Más información sobre Anotación de Segmentos →


Vinculación de Segmentos

Un nuevo tipo de anotación span_link para crear relaciones tipadas entre segmentos anotados. Soporta enlaces dirigidos y no dirigidos, relaciones n-arias, visualización de arcos y restricciones de etiquetas.

yaml
annotation_schemes:
  - annotation_type: span
    name: entities
    labels:
      - name: "PERSON"
        color: "#3b82f6"
      - name: "ORGANIZATION"
        color: "#22c55e"
 
  - annotation_type: span_link
    name: relations
    span_schema: entities
    link_types:
      - name: "WORKS_FOR"
        directed: true
        allowed_source_labels: ["PERSON"]
        allowed_target_labels: ["ORGANIZATION"]
        color: "#dc2626"

Más información sobre Vinculación de Segmentos →


Soporte Visual de IA

Cuatro nuevos endpoints de visión para asistencia de IA en la anotación de imágenes y video:

  • YOLO — Detección rápida de objetos local
  • Ollama Vision — Modelos de visión-lenguaje locales (LLaVA, Qwen-VL)
  • OpenAI Vision — Visión en la nube con GPT-4o
  • Anthropic Vision — Claude con visión

Las funcionalidades incluyen detección de objetos, pre-anotación, clasificación, pistas, detección de escenas, detección de fotogramas clave y seguimiento de objetos.

Más información sobre Soporte Visual de IA →


Personalización de Diseño

Crea diseños visuales personalizados sofisticados usando plantillas HTML y CSS. Potato genera un archivo de diseño editable, o puedes proporcionar una plantilla completamente personalizada con diseños de cuadrícula, opciones codificadas por color y estilos de sección.

yaml
task_layout: layouts/custom_task_layout.html

Se incluyen tres diseños de ejemplo: moderación de contenido, diálogo de QA y revisión médica.

Más información sobre Personalización de Diseño →


Justificaciones de Etiquetas

Una cuarta capacidad de IA que genera explicaciones equilibradas de por qué cada etiqueta podría aplicarse, ayudando a los anotadores a comprender diferentes perspectivas de clasificación.

yaml
ai_support:
  features:
    rationales:
      enabled: true

Más información sobre Soporte de IA →


Otras Mejoras

  • Más de 50 nuevas pruebas para mayor confiabilidad
  • Mejoras en el diseño responsivo
  • Organización mejorada del project-hub con ejemplos de diseño
  • Correcciones de errores en tipos de anotación

Comparación v2.0 vs v2.1

Funcionalidadv2.0v2.1
Visualización de InstanciasMediante hacks de anotaciónBloque dedicado instance_display
Objetivos de SegmentosCampo de texto únicoMulti-campo con target_field
Vinculación de SegmentosNo disponibleTipo completo span_link
IA VisualNo disponibleYOLO, Ollama Vision, OpenAI Vision, Anthropic Vision
Personalización de DiseñoAuto-generado básicoAuto-generado + plantillas personalizadas
Capacidades de IA3 (pistas, palabras clave, sugerencias)4 (+ justificaciones)

Potato 2.0

Potato 2.0 es una versión mayor que introduce potentes nuevas funcionalidades para anotación inteligente y escalable. Esta sección destaca las principales incorporaciones y mejoras.

Soporte de IA

Integra Modelos de Lenguaje Grandes para asistir a los anotadores con pistas inteligentes, resaltado de palabras clave y sugerencias de etiquetas.

Proveedores soportados:

  • OpenAI (GPT-4, GPT-3.5)
  • Anthropic (Claude 3, Claude 3.5)
  • Google (Gemini)
  • Ollama (modelos locales)
  • vLLM (auto-alojado)
yaml
ai_support:
  enabled: true
  endpoint_type: openai
  ai_config:
    model: gpt-4
    api_key: ${OPENAI_API_KEY}
  features:
    hints:
      enabled: true
    label_suggestions:
      enabled: true

Más información sobre Soporte de IA →


Anotación de Audio

Anotación de audio con todas las funcionalidades, con visualización de forma de onda impulsada por Peaks.js. Crea segmentos, etiqueta regiones de tiempo y anota habla con atajos de teclado.

Funcionalidades clave:

  • Visualización de forma de onda
  • Creación y etiquetado de segmentos
  • Preguntas de anotación por segmento
  • Más de 15 atajos de teclado
  • Caché de formas de onda del lado del servidor
yaml
annotation_schemes:
  - annotation_type: audio
    name: speakers
    mode: label
    labels:
      - Speaker A
      - Speaker B

Más información sobre Anotación de Audio →


Aprendizaje Activo

Prioriza automáticamente las instancias de anotación basándose en la incertidumbre del modelo. Entrena clasificadores con anotaciones existentes y enfoca a los anotadores en los ejemplos más informativos.

Capacidades:

  • Múltiples opciones de clasificador (LogisticRegression, RandomForest, SVC, MultinomialNB)
  • Varios vectorizadores (TF-IDF, Count, Hashing)
  • Persistencia del modelo entre reinicios
  • Selección mejorada con LLM
  • Soporte multi-esquema
yaml
active_learning:
  enabled: true
  schema_names:
    - sentiment
  min_instances_for_training: 30
  update_frequency: 50
  classifier:
    type: LogisticRegression

Más información sobre Aprendizaje Activo →


Fase de Entrenamiento

Cualifica a los anotadores con preguntas de práctica antes de la tarea principal. Proporciona retroalimentación inmediata y asegura la calidad mediante criterios de aprobación configurables.

Funcionalidades:

  • Preguntas de práctica con respuestas conocidas
  • Retroalimentación inmediata y explicaciones
  • Criterios de aprobación configurables
  • Opciones de reintento
  • Seguimiento de progreso en el panel de administración
yaml
phases:
  training:
    enabled: true
    data_file: "data/training.json"
    passing_criteria:
      min_correct: 8
      total_questions: 10

Más información sobre Fase de Entrenamiento →


Panel de Administración Mejorado

Interfaz integral de monitoreo y gestión para tareas de anotación.

Pestañas del panel:

  • Resumen: Métricas de alto nivel y tasas de finalización
  • Anotadores: Seguimiento de rendimiento, análisis de tiempos
  • Instancias: Explorar datos con puntuaciones de desacuerdo
  • Configuración: Ajuste de configuración en tiempo real
yaml
admin_api_key: ${ADMIN_API_KEY}

Más información sobre el Panel de Administración →


Backend de Base de Datos

Soporte de MySQL para despliegues a gran escala con agrupación de conexiones y soporte de transacciones.

yaml
database:
  type: mysql
  host: localhost
  database: potato_db
  user: ${DB_USER}
  password: ${DB_PASSWORD}

Potato crea automáticamente las tablas necesarias en el primer inicio.


Historial de Anotación

Seguimiento completo de todos los cambios de anotación con marcas de tiempo, IDs de usuario y tipos de acción. Permite auditoría y análisis de comportamiento.

json
{
  "history": [
    {
      "timestamp": "2024-01-15T10:30:00Z",
      "user": "annotator_1",
      "action": "create",
      "schema": "sentiment",
      "value": "Positive"
    }
  ]
}

Flujos de Trabajo Multi-Fase

Construye flujos de trabajo de anotación complejos con múltiples fases secuenciales:

  1. Consentimiento - Recopilación de consentimiento informado
  2. Pre-estudio - Demografía y cribado
  3. Instrucciones - Directrices de la tarea
  4. Entrenamiento - Preguntas de práctica
  5. Anotación - Tarea principal
  6. Post-estudio - Encuestas de retroalimentación
yaml
phases:
  consent:
    enabled: true
    data_file: "data/consent.json"
  prestudy:
    enabled: true
    data_file: "data/demographics.json"
  training:
    enabled: true
    data_file: "data/training.json"
  poststudy:
    enabled: true
    data_file: "data/feedback.json"

Más información sobre Flujos de Trabajo Multi-Fase →


Cambios de Configuración en v2.0

Nueva Estructura de Configuración

Potato 2.0 utiliza un formato de configuración más limpio:

v1 (anterior):

yaml
data_files:
  - data.json
id_key: id
text_key: text
output_file: annotations.json

v2 (nuevo):

yaml
data_files:
  - "data/data.json"
 
item_properties:
  id_key: id
  text_key: text
 
output_annotation_dir: "output/"
output_annotation_format: "json"

Requisito de Seguridad

Los archivos de configuración ahora deben estar ubicados dentro del task_dir:

yaml
# Valid - config.yaml is in the project directory
task_dir: "."
 
# Valid - config in configs/ subdirectory
task_dir: "my_project/"

Comparación Rápida

Funcionalidadv1v2.0v2.1v2.2
Soporte IA/LLMNoSí + IA Visual + Justificaciones+ Resaltado de Opciones
Anotación de AudioBásicaForma de onda completaForma de onda completaForma de onda completa
Aprendizaje ActivoNoSí + Ordenamiento por Diversidad
Visualización de InstanciasNoNo
Vinculación de SegmentosNoNo
Anotación de EventosNoNoNo
Vinculación de EntidadesNoNoNo
Pares/Triaje/Correferencia/ÁrbolesNoNoNo
Personalización de DiseñoNoAuto-generadoAuto + Plantillas personalizadasAuto + Plantillas personalizadas
Fase de EntrenamientoNo
Panel de AdministraciónBásicoMejoradoMejoradoMejorado + MACE
Backend de Base de DatosSolo archivosArchivos + MySQLArchivos + MySQLArchivos + MySQL
CLI de ExportaciónNoNoNoSí (COCO, YOLO, CoNLL, etc.)
Instrumentos de EncuestaNoNoNo55 cuestionarios validados
Fuentes de Datos RemotasNoNoNoS3, GDrive, HuggingFace, etc.

Guía de Migración

Actualizar Tu Configuración (v1 a v2)

  1. Configuración de datos

    yaml
    # Old
    id_key: id
    text_key: text
     
    # New
    item_properties:
      id_key: id
      text_key: text
  2. Configuración de salida

    yaml
    # Old
    output_file: annotations.json
     
    # New
    output_annotation_dir: "output/"
    output_annotation_format: "json"
  3. Ubicación del archivo de configuración Asegúrate de que tu archivo de configuración esté dentro del directorio del proyecto.

Iniciar el Servidor

bash
# v2 command
python -m potato start config.yaml -p 8000
 
# Or shorthand
potato start config.yaml

Comenzar

¿Listo para probar Potato? Comienza con la Guía de Inicio Rápido o explora funcionalidades específicas:

Funcionalidades de v2.2:

Funcionalidades de v2.1:

Funcionalidades Principales: