Skip to content

Preguntas frecuentes

Encuentre respuestas a preguntas comunes sobre Potato. ¿No encuentra lo que busca? Únase a nuestro Discord o consulte la documentación.

Primeros pasos

Potato (Portable Text Annotation Tool) es una herramienta de anotación gratuita y de código abierto para crear conjuntos de datos de alta calidad. Soporta anotación de texto, imágenes, audio y video con un sistema de configuración sencillo basado en YAML.

Sí, Potato es gratuito y de código abierto bajo la PolyForm Shield License 1.0.0. Esta licencia permite el uso gratuito para investigación, educación y fines no comerciales. La licencia incluye una cláusula de no competencia que restringe el uso de Potato para crear plataformas de anotación competidoras. Consulte el archivo LICENSE en el repositorio de GitHub para más detalles.

No se requiere programación. Potato usa archivos de configuración YAML que son legibles y fáciles de escribir. Nuestro Playground ofrece una interfaz visual para crear configuraciones sin escribir código.

Instale mediante pip: `pip install potato-annotation`. Luego ejecute `potato start my_project -c config.yaml` para iniciar su servidor de anotación. Consulte nuestra guía de inicio rápido para instrucciones detalladas.

Potato requiere Python 3.7 o superior. Recomendamos usar Python 3.10+ para la mejor experiencia.

Datos y privacidad

Sus datos permanecen en su máquina. Potato se ejecuta completamente de forma local y nunca envía sus datos a servidores externos. Esto lo hace ideal para datos sensibles como registros médicos o contenido propietario.

Sí. Dado que Potato es autoalojado y se ejecuta localmente, usted mantiene el control total sobre sus datos. Ningún dato sale de su infraestructura, lo que lo hace apto para requisitos de HIPAA, GDPR y otras normativas de cumplimiento.

Potato soporta varios formatos de entrada, incluyendo texto plano, JSON, JSONL, CSV, TSV, imágenes (PNG, JPG, GIF, WebP), audio (MP3, WAV, OGG) y archivos de video. La salida puede exportarse a JSON, JSONL, CSV y formatos especializados como CoNLL, spaCy, COCO y conjuntos de datos de HuggingFace.

Funciones de anotación

Potato soporta: botones de radio (opción única), casillas de verificación (selección múltiple), escalas Likert, entrada de texto, anotación de span (resaltado), cuadros delimitadores, polígonos, comparación por pares, escalas Best-Worst y más. Consulte nuestra galería para ver ejemplos.

Sí. Una sola tarea de anotación puede incluir cualquier combinación de esquemas de anotación. Por ejemplo, los anotadores pueden resaltar entidades (anotación de span), clasificar sentimiento (botones de radio) y proporcionar comentarios (entrada de texto) en el mismo elemento.

Sí. Potato soporta clasificación de imágenes con etiquetas de radio/casilla de verificación, anotación con cuadros delimitadores para detección de objetos y anotación con polígonos para tareas de segmentación.

Sí. Potato puede mostrar formas de onda de audio y reproductores de video junto con controles de anotación. Esto es útil para revisión de transcripciones, diarización de hablantes, detección de emociones y tareas similares.

Añada un esquema de anotación de span en su configuración con el texto a resaltar. Los anotadores pueden seleccionar fragmentos de texto y asignar etiquetas. Consulte nuestros ejemplos de NER y anotación de span en la galería.

Gestión de anotadores

Potato soporta múltiples anotadores de forma nativa. Cada anotador inicia sesión con un identificador único y sus anotaciones se rastrean por separado. Puede configurar solapamiento para que múltiples anotadores etiqueten los mismos elementos para control de calidad.

Sí. Potato se integra con Prolific y Amazon Mechanical Turk. Los anotadores son redirigidos desde la plataforma, completan las tareas en Potato y son devueltos con códigos de finalización.

Potato registra qué elementos han sido anotados por múltiples anotadores. Puede exportar las anotaciones y calcular métricas de acuerdo (Kappa de Cohen, Alpha de Krippendorff, etc.) usando bibliotecas estándar de Python.

Sí. Puede añadir elementos de verificación de atención, configurar solapamiento de anotación requerido y usar el panel de administración para supervisar el progreso de los anotadores e identificar posibles problemas.

Integración con LLM

Sí. Potato se integra con OpenAI, Anthropic Claude, Google Gemini y LLM locales mediante Ollama. Puede configurar la preanotación con IA para acelerar los flujos de trabajo de anotación humana.

Añada una sección `llm` a su configuración especificando el proveedor, modelo y plantilla de prompt. Potato llamará a la API del LLM para cada elemento y rellenará previamente los campos de anotación que los anotadores pueden aceptar o corregir.

Sí. Potato soporta Ollama para ejecutar LLM locales. Esto mantiene sus datos completamente privados mientras se beneficia de la asistencia de IA.

Sí. Potato es muy adecuado para recopilar datos de preferencia humana para RLHF. Use la comparación por pares para que los anotadores elijan entre salidas de modelos, o escalas Likert para calificar la calidad de las respuestas.

Despliegue

Sí. Aunque Potato se ejecuta localmente por defecto, puede desplegarlo en cualquier servidor. Ejecútelo detrás de nginx o Apache para HTTPS, o use Docker para un despliegue en contenedores.

Potato puede ejecutarse en contenedores usando un Dockerfile personalizado. Aunque actualmente no proporcionamos imágenes oficiales de Docker, puede crear la suya propia usando una imagen base estándar de Python. Consulte nuestra documentación de despliegue para ver ejemplos.

Sí. Cuando se despliega en un servidor, múltiples anotadores pueden acceder a la misma instancia de Potato simultáneamente. El trabajo de cada anotador se registra por separado.

Despliegue Potato detrás de un proxy inverso como nginx o Caddy que gestione la terminación SSL. Consulte nuestra guía de despliegue para ejemplos de configuración.

Solución de problemas

Problemas comunes: 1) Verifique que su config.yaml tenga sintaxis YAML válida. 2) Asegúrese de que su archivo de datos exista y esté correctamente formateado. 3) Compruebe que el puerto (por defecto 8000) no esté en uso. 4) Revise la salida del terminal para mensajes de error específicos.

Verifique que: 1) Hizo clic en el botón Guardar/Enviar. 2) El directorio de salida tiene permisos de escritura. 3) Todos los campos obligatorios están completos. Revise la consola del navegador para errores de JavaScript.

Elimine el archivo de anotación del anotador del directorio de salida. Su asignación se regenerará en el próximo inicio de sesión.

Únase a nuestra comunidad en Discord para ayuda en tiempo real, consulte los Issues de GitHub para problemas conocidos o explore nuestra documentación. ¡La comunidad es amigable y receptiva!

¿Aún tiene preguntas?

Nuestra comunidad está aquí para ayudar. Únase a Discord para soporte en tiempo real o explore la documentación para guías detalladas.