Skip to content
Tutorials3 min read

Anotación de Seguimiento de Múltiples Objetos

Una visión general de los conceptos de anotación de seguimiento de múltiples objetos y cómo las capacidades de anotación de video de Potato pueden soportar flujos de trabajo básicos de seguimiento.

Potato Team·

Anotación de Seguimiento de Múltiples Objetos

La anotación de Seguimiento de Múltiples Objetos (MOT) crea datos de entrenamiento para vigilancia, conducción autónoma y análisis deportivo. Este tutorial discute los conceptos de anotación MOT y cómo las funciones actuales de anotación de video de Potato pueden soportar flujos de trabajo básicos de seguimiento.

Desafíos de la Anotación MOT

  • Mantener IDs de objetos consistentes a través de los fotogramas
  • Manejar oclusiones y reapariciones
  • Seguimiento en escenas concurridas
  • Gestionar cambios de ID y fusiones

Soporte Actual de Anotación de Video

Potato actualmente soporta anotación básica de video a través del tipo video_annotation. Aunque las funciones específicas de MOT como gestión automática de IDs, interpolación y manejo de oclusiones aún no están implementadas, puedes configurar flujos de trabajo básicos de etiquetado de video.

Configuración Básica de Anotación de Video

yaml
annotation_task_name: "Video Object Labeling"
 
data_files:
  - data/videos.json
 
annotation_schemes:
  - annotation_type: video_annotation
    name: objects
    description: "Label objects in video frames"
    video_path: video
    labels:
      - name: person
      - name: vehicle
      - name: cyclist

Formato de Datos de Ejemplo

Tu archivo data/videos.json debe contener entradas con rutas de video:

json
[
  {
    "id": "video_001",
    "video": "/path/to/video.mp4"
  },
  {
    "id": "video_002",
    "video": "/path/to/another_video.mp4"
  }
]

Flujo de Trabajo de Seguimiento Manual

Sin funciones dedicadas de MOT, aún puedes realizar anotación de seguimiento manualmente:

Creación Manual de Pistas

  1. Navega al fotograma donde un objeto aparece por primera vez
  2. Usa la interfaz de anotación de video para etiquetar el objeto
  3. Incluye un identificador consistente en tu anotación (p.ej., "person_1")
  4. Avanza a los fotogramas siguientes y continúa etiquetando con el mismo identificador

Manejo de Oclusiones

Cuando un objeto queda ocluido:

  1. Anota el último fotograma donde el objeto era visible
  2. Cuando el objeto reaparece, usa el mismo identificador para mantener la continuidad de la pista
  3. Documenta los períodos de oclusión en tus notas de anotación

Funciones MOT Propuestas

Las siguientes funciones mejorarían las capacidades de anotación MOT de Potato y se están considerando para desarrollo futuro:

  • Asignación automática de IDs: Auto-incremento de IDs para nuevos objetos
  • Interpolación de pistas: Interpolación lineal o cúbica entre fotogramas clave
  • Manejo de oclusiones: Niveles de visibilidad (visible, parcial, pesada, no_visible)
  • Visualización de trayectorias: Mostrar rutas de objetos a través de los fotogramas
  • Panel de gestión de pistas: Fusionar, dividir y gestionar IDs de pistas
  • Atributos por fotograma: Propiedades que cambian fotograma a fotograma

Si estás interesado en estas funciones, por favor contacta al equipo de desarrollo de Potato o contribuye al proyecto.

Consejos para Anotación MOT Manual

  1. Trabajar en segmentos cortos: 100-200 fotogramas a la vez
  2. Nomenclatura consistente: Usa un esquema de ID claro (p.ej., "person_001", "vehicle_023")
  3. Documenta tu proceso: Mantén notas sobre oclusiones y decisiones de pistas
  4. Revisiones en pasadas: Mira hacia adelante y luego hacia atrás para detectar errores
  5. Usa herramientas externas: Considera pre-procesar con modelos de detección

Enfoques Alternativos

Para proyectos que requieren capacidades completas de anotación MOT:

  1. Flujo de trabajo híbrido: Usa Potato para el etiquetado inicial y herramientas especializadas de MOT para la gestión de pistas
  2. Pre-anotación: Ejecuta detectores de objetos para generar cuadros delimitadores iniciales, luego refina en Potato
  3. Post-procesamiento: Exporta las anotaciones de Potato y aplica algoritmos de seguimiento externamente

Próximos Pasos


Para documentación actual de anotación de video, consulta /docs/features/image-annotation.