Skip to content
Esta página aún no está disponible en su idioma. Se muestra la versión en inglés.

Bildannotation

Bilder mit Begrenzungsrahmen, Polygonen, Freihandzeichnungen und Landmarkpunkten annotieren.

Bildannotation

Potatos Bildannotationssystem unterstützt mehrere Annotationsmethoden für Computer-Vision-Aufgaben, einschließlich Objekterkennung, Segmentierung und Keypoint-Annotation.

Unterstützte Werkzeuge

WerkzeugBeschreibungAnwendungsfall
bboxRechteckige BegrenzungsrahmenObjekterkennung
polygonMehrpunktige PolygoneInstanzsegmentierung
freeformFreihandzeichnungUnregelmäßige Formen
landmarkPunktmarkierungenKeypoint-Erkennung
fillPixelgenaues FüllwerkzeugSegmentierungsmasken
eraserGemalte Bereiche löschenKorrektur von Segmentierungsmasken
brushPinselwerkzeugFeinkörnige Segmentierung

Grundkonfiguration

yaml
annotation_schemes:
  - name: "objects"
    description: "Draw boxes around all objects"
    annotation_type: "image_annotation"
    tools:
      - bbox
    labels:
      - person
      - car
      - bicycle

Konfigurationsoptionen

FeldTypStandardBeschreibung
namestringErforderlichEindeutiger Bezeichner für die Annotation
descriptionstringErforderlichAnweisungen für Annotatoren
annotation_typestringErforderlichMuss "image_annotation" sein
toolslistErforderlichAktivierte Annotationswerkzeuge (bbox, polygon, freeform, landmark, fill, eraser, brush)
labelslistErforderlichKategoriebeschriftungen für Annotationen
zoom_enabledbooleantrueZoom-Steuerung aktivieren
pan_enabledbooleantrueZiehnavigation aktivieren
min_annotationsinteger0Mindestanzahl erforderlicher Annotationen
max_annotationsintegernullMaximale Anzahl erlaubter Annotationen (null = unbegrenzt)
freeform_brush_sizeinteger5Pinselgröße für Freihandzeichnung
freeform_simplifyfloat2.0Pfadvereinfachungsfaktor

Beschriftungskonfiguration

Beschriftungen können einfache Zeichenketten oder detaillierte Objekte sein:

yaml
# Simple labels (auto-colored)
labels:
  - person
  - car
  - tree
 
# Detailed labels with custom colors and shortcuts
labels:
  - name: "person"
    color: "#FF6B6B"
    key_value: "1"
  - name: "car"
    color: "#4ECDC4"
    key_value: "2"
  - name: "bicycle"
    color: "#45B7D1"
    key_value: "3"

Beispiele

Objekterkennung (Begrenzungsrahmen)

yaml
annotation_schemes:
  - name: "detection"
    description: "Draw bounding boxes around all vehicles"
    annotation_type: "image_annotation"
    tools:
      - bbox
    labels:
      - name: "car"
        color: "#3B82F6"
        key_value: "1"
      - name: "truck"
        color: "#10B981"
        key_value: "2"
      - name: "motorcycle"
        color: "#F59E0B"
        key_value: "3"
    min_annotations: 1
    zoom_enabled: true

Instanzsegmentierung (Polygone)

yaml
annotation_schemes:
  - name: "segmentation"
    description: "Draw polygons around each object"
    annotation_type: "image_annotation"
    tools:
      - polygon
    labels:
      - name: "building"
        color: "#8B5CF6"
      - name: "road"
        color: "#64748B"
      - name: "vegetation"
        color: "#22C55E"
    zoom_enabled: true
    pan_enabled: true

Keypoint-Annotation (Landmarken)

yaml
annotation_schemes:
  - name: "facial_landmarks"
    description: "Mark facial keypoints"
    annotation_type: "image_annotation"
    tools:
      - landmark
    labels:
      - name: "left_eye"
        color: "#3B82F6"
      - name: "right_eye"
        color: "#3B82F6"
      - name: "nose"
        color: "#10B981"
      - name: "left_mouth"
        color: "#F59E0B"
      - name: "right_mouth"
        color: "#F59E0B"

Mehrere Werkzeuge

yaml
annotation_schemes:
  - name: "mixed_annotation"
    description: "Use boxes for objects and polygons for regions"
    annotation_type: "image_annotation"
    tools:
      - bbox
      - polygon
    labels:
      - name: "object"
        color: "#3B82F6"
      - name: "region"
        color: "#10B981"

Tastaturkürzel

TasteAktion
bBegrenzungsrahmen-Werkzeug aktivieren
pPolygon-Werkzeug aktivieren
fFreihand-Werkzeug aktivieren
lLandmarken-Werkzeug aktivieren
1-9Beschriftung auswählen
DeleteAusgewählte Annotation entfernen
Ctrl+ZRückgängig machen
Ctrl+YWiederholen
+ / -Hinein-/herauszoomen

Datenformat

Eingabedaten

Die Datendatei sollte Bildpfade oder URLs enthalten:

json
[
  {
    "id": "img_001",
    "image_url": "https://example.com/images/photo1.jpg"
  },
  {
    "id": "img_002",
    "image_url": "/data/images/photo2.png"
  }
]

Das Bildfeld in der Konfiguration festlegen:

yaml
item_properties:
  id_key: id
  text_key: image_url

Ausgabeformat

Annotationen enthalten Geometriedaten für jede Annotation:

json
{
  "id": "img_001",
  "annotations": {
    "objects": [
      {
        "id": "ann_1",
        "type": "bbox",
        "label": "car",
        "geometry": {
          "x": 100,
          "y": 150,
          "width": 200,
          "height": 100
        }
      },
      {
        "id": "ann_2",
        "type": "polygon",
        "label": "building",
        "geometry": {
          "points": [
            [50, 50],
            [150, 50],
            [150, 200],
            [50, 200]
          ]
        }
      }
    ]
  }
}

Unterstützte Bildformate

  • JPEG / JPG
  • PNG
  • GIF
  • WebP

Segmentierungsmasken

Neu in v2.2.0

Die Werkzeuge fill, eraser und brush ermöglichen pixelgenaue Segmentierungsmasken-Annotation. Diese Werkzeuge sind ideal für semantische Segmentierungsaufgaben, bei denen präzise Regionsgrenzen benötigt werden.

yaml
annotation_schemes:
  - name: "segmentation"
    description: "Paint segmentation masks"
    annotation_type: "image_annotation"
    tools:
      - fill
      - eraser
      - brush
    labels:
      - name: "foreground"
        color: "#3B82F6"
      - name: "background"
        color: "#6B7280"
    freeform_brush_size: 10
TasteAktion
iFüll-Werkzeug aktivieren
eRadiergummi-Werkzeug aktivieren
rPinsel-Werkzeug aktivieren

PDF/Dokument-Begrenzungsrahmen

Neu in v2.2.0

Begrenzungsrahmen auf PDF-Seiten und Dokumentbildern zeichnen. In Kombination mit dem pdf-Anzeigetyp in instance_display können Annotatoren Rahmen auf einzelnen Seiten von PDF-Dokumenten zeichnen.

yaml
instance_display:
  fields:
    - key: pdf_url
      type: pdf
 
annotation_schemes:
  - name: "document_regions"
    description: "Draw boxes around figures and tables"
    annotation_type: "image_annotation"
    tools:
      - bbox
    labels:
      - name: "figure"
        color: "#3B82F6"
      - name: "table"
        color: "#10B981"
      - name: "equation"
        color: "#F59E0B"

Bewährte Vorgehensweisen

  1. Geeignete Werkzeuge verwenden - Begrenzungsrahmen für schnelle Erkennung, Polygone für präzise Grenzen, Füll-/Pinselwerkzeuge für Segmentierung
  2. Klare Beschriftungen definieren - Eindeutige, nicht überlappende Kategorien verwenden
  3. Annotationslimits setzen - min_annotations für vollständige Erfassung nutzen
  4. Zoom aktivieren - Unverzichtbar für detaillierte Annotationen bei hochauflösenden Bildern
  5. Tastaturkürzel verwenden - Beschleunigt die Annotation erheblich
  6. Beschriftungsfarben angeben - Erleichtert die visuelle Unterscheidung von Annotationen