Skip to content

Anotação de Imagens

Anote imagens no Potato com caixas delimitadoras, polígonos, desenho à mão livre e pontos de referência. Inclui zoom, deslocamento, classificação multirrótulo e pré-rotulagem por IA.

O sistema de anotação de imagens do Potato oferece suporte a vários métodos de anotação para tarefas de visão computacional, incluindo detecção de objetos, segmentação e anotação de pontos-chave.

Ferramentas Suportadas

FerramentaDescriçãoCaso de Uso
bboxCaixas delimitadoras retangularesDetecção de objetos
polygonPolígonos de múltiplos pontosSegmentação de instâncias
freeformDesenho à mão livreFormas irregulares
landmarkMarcadores de pontosDetecção de pontos-chave
fillFerramenta de preenchimento ao nível do pixelMáscaras de segmentação
eraserApagar regiões pintadasCorreção de máscaras de segmentação
brushFerramenta de pincelSegmentação detalhada

Configuração Básica

yaml
annotation_schemes:
  - name: "objects"
    description: "Draw boxes around all objects"
    annotation_type: "image_annotation"
    tools:
      - bbox
    labels:
      - person
      - car
      - bicycle

Opções de Configuração

CampoTipoPadrãoDescrição
namestringObrigatórioIdentificador único da anotação
descriptionstringObrigatórioInstruções exibidas aos anotadores
annotation_typestringObrigatórioDeve ser "image_annotation"
toolslistObrigatórioFerramentas de anotação habilitadas (bbox, polygon, freeform, landmark, fill, eraser, brush)
labelslistObrigatórioRótulos de categoria para as anotações
zoom_enabledbooleantrueHabilita os controles de zoom
pan_enabledbooleantrueHabilita a navegação por arraste
min_annotationsinteger0Número mínimo de anotações exigidas
max_annotationsintegernullNúmero máximo de anotações permitidas (null = ilimitado)
freeform_brush_sizeinteger5Tamanho do pincel para desenho à mão livre
freeform_simplifyfloat2.0Fator de simplificação do traçado

Configuração de Rótulos

Os rótulos podem ser strings simples ou objetos detalhados:

yaml
# Simple labels (auto-colored)
labels:
  - person
  - car
  - tree
 
# Detailed labels with custom colors and shortcuts
labels:
  - name: "person"
    color: "#FF6B6B"
    key_value: "1"
  - name: "car"
    color: "#4ECDC4"
    key_value: "2"
  - name: "bicycle"
    color: "#45B7D1"
    key_value: "3"

Exemplos

Detecção de Objetos (Caixas Delimitadoras)

yaml
annotation_schemes:
  - name: "detection"
    description: "Draw bounding boxes around all vehicles"
    annotation_type: "image_annotation"
    tools:
      - bbox
    labels:
      - name: "car"
        color: "#3B82F6"
        key_value: "1"
      - name: "truck"
        color: "#10B981"
        key_value: "2"
      - name: "motorcycle"
        color: "#F59E0B"
        key_value: "3"
    min_annotations: 1
    zoom_enabled: true

Segmentação de Instâncias (Polígonos)

yaml
annotation_schemes:
  - name: "segmentation"
    description: "Draw polygons around each object"
    annotation_type: "image_annotation"
    tools:
      - polygon
    labels:
      - name: "building"
        color: "#8B5CF6"
      - name: "road"
        color: "#64748B"
      - name: "vegetation"
        color: "#22C55E"
    zoom_enabled: true
    pan_enabled: true

Anotação de Pontos-Chave (Pontos de Referência)

yaml
annotation_schemes:
  - name: "facial_landmarks"
    description: "Mark facial keypoints"
    annotation_type: "image_annotation"
    tools:
      - landmark
    labels:
      - name: "left_eye"
        color: "#3B82F6"
      - name: "right_eye"
        color: "#3B82F6"
      - name: "nose"
        color: "#10B981"
      - name: "left_mouth"
        color: "#F59E0B"
      - name: "right_mouth"
        color: "#F59E0B"

Múltiplas Ferramentas

yaml
annotation_schemes:
  - name: "mixed_annotation"
    description: "Use boxes for objects and polygons for regions"
    annotation_type: "image_annotation"
    tools:
      - bbox
      - polygon
    labels:
      - name: "object"
        color: "#3B82F6"
      - name: "region"
        color: "#10B981"

Atalhos de Teclado

TeclaAção
bAtivar a ferramenta de caixa delimitadora
pAtivar a ferramenta de polígono
fAtivar a ferramenta de desenho livre
lAtivar a ferramenta de ponto de referência
1-9Selecionar rótulo
DeleteRemover a anotação selecionada
Ctrl+ZDesfazer
Ctrl+YRefazer
+ / -Aproximar/afastar o zoom

Formato dos Dados

Dados de Entrada

Seu arquivo de dados deve incluir os caminhos ou URLs das imagens:

json
[
  {
    "id": "img_001",
    "image_url": "https://example.com/images/photo1.jpg"
  },
  {
    "id": "img_002",
    "image_url": "/data/images/photo2.png"
  }
]

Configure o campo de imagem na sua configuração:

yaml
item_properties:
  id_key: id
  text_key: image_url

Formato de Saída

As anotações incluem dados geométricos para cada anotação:

json
{
  "id": "img_001",
  "annotations": {
    "objects": [
      {
        "id": "ann_1",
        "type": "bbox",
        "label": "car",
        "geometry": {
          "x": 100,
          "y": 150,
          "width": 200,
          "height": 100
        }
      },
      {
        "id": "ann_2",
        "type": "polygon",
        "label": "building",
        "geometry": {
          "points": [
            [50, 50],
            [150, 50],
            [150, 200],
            [50, 200]
          ]
        }
      }
    ]
  }
}

Formatos de Imagem Suportados

  • JPEG / JPG
  • PNG
  • GIF
  • WebP

Máscaras de Segmentação

Novo na v2.2.0

As ferramentas fill, eraser e brush permitem a anotação de máscaras de segmentação ao nível do pixel. Essas ferramentas são ideais para tarefas de segmentação semântica em que são necessários limites de região precisos.

yaml
annotation_schemes:
  - name: "segmentation"
    description: "Paint segmentation masks"
    annotation_type: "image_annotation"
    tools:
      - fill
      - eraser
      - brush
    labels:
      - name: "foreground"
        color: "#3B82F6"
      - name: "background"
        color: "#6B7280"
    freeform_brush_size: 10
TeclaAção
iAtivar a ferramenta de preenchimento
eAtivar a ferramenta de apagar
rAtivar a ferramenta de pincel

Caixas Delimitadoras em PDF/Documentos

Novo na v2.2.0

Desenhe caixas delimitadoras em páginas de PDF e imagens de documentos. Quando combinado com o tipo de exibição pdf em instance_display, os anotadores podem desenhar caixas em páginas individuais de documentos PDF.

yaml
instance_display:
  fields:
    - key: pdf_url
      type: pdf
 
annotation_schemes:
  - name: "document_regions"
    description: "Draw boxes around figures and tables"
    annotation_type: "image_annotation"
    tools:
      - bbox
    labels:
      - name: "figure"
        color: "#3B82F6"
      - name: "table"
        color: "#10B981"
      - name: "equation"
        color: "#F59E0B"

Boas Práticas

  1. Use as ferramentas adequadas - Caixas delimitadoras para detecção rápida, polígonos para limites precisos, preenchimento/pincel para segmentação
  2. Defina rótulos claros - Use categorias distintas e sem sobreposição
  3. Defina limites de anotação - Use min_annotations para garantir a integridade
  4. Habilite o zoom - Essencial para anotações detalhadas em imagens de alta resolução
  5. Use atalhos de teclado - Acelera significativamente a anotação
  6. Forneça cores aos rótulos - Facilita distinguir as anotações visualmente