Skip to content

توسيم الصور

توسيم الصور بمربعات الإحاطة والمضلعات والرسم الحر ونقاط المعالم.

توسيم الصور

يدعم نظام توسيم الصور في Potato طرق توسيم متعددة لمهام الرؤية الحاسوبية بما في ذلك كشف الكائنات، والتجزئة، وتوسيم النقاط المفتاحية.

الأدوات المدعومة

الأداةالوصفحالة الاستخدام
bboxمربعات إحاطة مستطيلةكشف الكائنات
polygonمضلعات متعددة النقاطتجزئة النسخ
freeformرسم حرأشكال غير منتظمة
landmarkعلامات نقطيةكشف النقاط المفتاحية
fillأداة ملء على مستوى البكسلأقنعة التجزئة
eraserمسح المناطق المرسومةتصحيح أقنعة التجزئة
brushأداة فرشاة الرسمتجزئة دقيقة

الإعداد الأساسي

yaml
annotation_schemes:
  - name: "objects"
    description: "Draw boxes around all objects"
    annotation_type: "image_annotation"
    tools:
      - bbox
    labels:
      - person
      - car
      - bicycle

خيارات الإعدادات

الحقلالنوعالافتراضيالوصف
namestringمطلوبمعرّف فريد للتوسيم
descriptionstringمطلوبالتعليمات المعروضة للموسِّمين
annotation_typestringمطلوبيجب أن يكون "image_annotation"
toolslistمطلوبأدوات التوسيم المفعلة (bbox، polygon، freeform، landmark، fill، eraser، brush)
labelslistمطلوبتسميات الفئات للتوسيمات
zoom_enabledbooleantrueتفعيل عناصر التكبير
pan_enabledbooleantrueتفعيل التنقل بالسحب
min_annotationsinteger0الحد الأدنى للتوسيمات المطلوبة
max_annotationsintegernullالحد الأقصى للتوسيمات المسموحة (null = غير محدود)
freeform_brush_sizeinteger5حجم الفرشاة للرسم الحر
freeform_simplifyfloat2.0عامل تبسيط المسار

إعداد التسميات

يمكن أن تكون التسميات نصوصًا بسيطة أو كائنات مفصلة:

yaml
# Simple labels (auto-colored)
labels:
  - person
  - car
  - tree
 
# Detailed labels with custom colors and shortcuts
labels:
  - name: "person"
    color: "#FF6B6B"
    key_value: "1"
  - name: "car"
    color: "#4ECDC4"
    key_value: "2"
  - name: "bicycle"
    color: "#45B7D1"
    key_value: "3"

أمثلة

كشف الكائنات (مربعات الإحاطة)

yaml
annotation_schemes:
  - name: "detection"
    description: "Draw bounding boxes around all vehicles"
    annotation_type: "image_annotation"
    tools:
      - bbox
    labels:
      - name: "car"
        color: "#3B82F6"
        key_value: "1"
      - name: "truck"
        color: "#10B981"
        key_value: "2"
      - name: "motorcycle"
        color: "#F59E0B"
        key_value: "3"
    min_annotations: 1
    zoom_enabled: true

تجزئة النسخ (المضلعات)

yaml
annotation_schemes:
  - name: "segmentation"
    description: "Draw polygons around each object"
    annotation_type: "image_annotation"
    tools:
      - polygon
    labels:
      - name: "building"
        color: "#8B5CF6"
      - name: "road"
        color: "#64748B"
      - name: "vegetation"
        color: "#22C55E"
    zoom_enabled: true
    pan_enabled: true

توسيم النقاط المفتاحية (المعالم)

yaml
annotation_schemes:
  - name: "facial_landmarks"
    description: "Mark facial keypoints"
    annotation_type: "image_annotation"
    tools:
      - landmark
    labels:
      - name: "left_eye"
        color: "#3B82F6"
      - name: "right_eye"
        color: "#3B82F6"
      - name: "nose"
        color: "#10B981"
      - name: "left_mouth"
        color: "#F59E0B"
      - name: "right_mouth"
        color: "#F59E0B"

أدوات متعددة

yaml
annotation_schemes:
  - name: "mixed_annotation"
    description: "Use boxes for objects and polygons for regions"
    annotation_type: "image_annotation"
    tools:
      - bbox
      - polygon
    labels:
      - name: "object"
        color: "#3B82F6"
      - name: "region"
        color: "#10B981"

اختصارات لوحة المفاتيح

المفتاحالإجراء
bتفعيل أداة مربع الإحاطة
pتفعيل أداة المضلع
fتفعيل أداة الرسم الحر
lتفعيل أداة المعلم
1-9اختيار التسمية
Deleteإزالة التوسيم المحدد
Ctrl+Zتراجع
Ctrl+Yإعادة
+ / -تكبير/تصغير

صيغة البيانات

بيانات الإدخال

يجب أن يتضمن ملف البيانات مسارات صور أو عناوين URL:

json
[
  {
    "id": "img_001",
    "image_url": "https://example.com/images/photo1.jpg"
  },
  {
    "id": "img_002",
    "image_url": "/data/images/photo2.png"
  }
]

إعداد حقل الصورة في الإعدادات:

yaml
item_properties:
  id_key: id
  text_key: image_url

صيغة المخرجات

تتضمن التوسيمات بيانات هندسية لكل توسيم:

json
{
  "id": "img_001",
  "annotations": {
    "objects": [
      {
        "id": "ann_1",
        "type": "bbox",
        "label": "car",
        "geometry": {
          "x": 100,
          "y": 150,
          "width": 200,
          "height": 100
        }
      },
      {
        "id": "ann_2",
        "type": "polygon",
        "label": "building",
        "geometry": {
          "points": [
            [50, 50],
            [150, 50],
            [150, 200],
            [50, 200]
          ]
        }
      }
    ]
  }
}

صيغ الصور المدعومة

  • JPEG / JPG
  • PNG
  • GIF
  • WebP

أقنعة التجزئة

جديد في الإصدار 2.2.0

تتيح أدوات fill وeraser وbrush توسيم أقنعة التجزئة على مستوى البكسل. هذه الأدوات مثالية لمهام التجزئة الدلالية حيث تكون حدود المناطق الدقيقة مطلوبة.

yaml
annotation_schemes:
  - name: "segmentation"
    description: "Paint segmentation masks"
    annotation_type: "image_annotation"
    tools:
      - fill
      - eraser
      - brush
    labels:
      - name: "foreground"
        color: "#3B82F6"
      - name: "background"
        color: "#6B7280"
    freeform_brush_size: 10
المفتاحالإجراء
iتفعيل أداة الملء
eتفعيل أداة المسح
rتفعيل أداة الفرشاة

مربعات الإحاطة لمستندات PDF

جديد في الإصدار 2.2.0

ارسم مربعات إحاطة على صفحات PDF وصور المستندات. عند دمجها مع نوع العرض pdf في instance_display، يمكن للموسِّمين رسم مربعات على صفحات فردية من مستندات PDF.

yaml
instance_display:
  fields:
    - key: pdf_url
      type: pdf
 
annotation_schemes:
  - name: "document_regions"
    description: "Draw boxes around figures and tables"
    annotation_type: "image_annotation"
    tools:
      - bbox
    labels:
      - name: "figure"
        color: "#3B82F6"
      - name: "table"
        color: "#10B981"
      - name: "equation"
        color: "#F59E0B"

أفضل الممارسات

  1. استخدم الأدوات المناسبة - مربعات الإحاطة للكشف السريع، والمضلعات للحدود الدقيقة، والملء/الفرشاة للتجزئة
  2. حدد تسميات واضحة - استخدم فئات متميزة وغير متداخلة
  3. حدد حدود التوسيم - استخدم min_annotations لضمان الاكتمال
  4. فعّل التكبير - ضروري للتوسيمات المفصلة على الصور عالية الدقة
  5. استخدم اختصارات لوحة المفاتيح - تسرّع التوسيم بشكل ملحوظ
  6. وفّر ألوان التسميات - يسهّل التمييز بين التوسيمات بصريًا