توصيف تتبع الأجسام المتعددة
نظرة عامة على مفاهيم توصيف تتبع الأجسام المتعددة وكيف يمكن لإمكانيات توصيف الفيديو في Potato دعم سير عمل التتبع الأساسي.
توصيف تتبع الأجسام المتعددة
يُنشئ توصيف تتبع الأجسام المتعددة (MOT) بيانات تدريب للمراقبة والقيادة الذاتية وتحليلات الرياضة. يناقش هذا الدرس مفاهيم توصيف MOT وكيف يمكن لميزات توصيف الفيديو الحالية في Potato دعم سير عمل التتبع الأساسي.
تحديات توصيف MOT
- الحفاظ على معرّفات ثابتة للأجسام عبر الإطارات
- التعامل مع الحجب وإعادة الظهور
- التتبع عبر المشاهد المزدحمة
- إدارة تبديل ودمج المعرّفات
دعم توصيف الفيديو الحالي
يدعم Potato حالياً توصيف الفيديو الأساسي من خلال نوع video_annotation. على الرغم من أن ميزات MOT المتخصصة مثل إدارة المعرّفات التلقائية والاستيفاء ومعالجة الحجب لم تُطبّق بعد، يمكنك إعداد سير عمل أساسي لتوسيم الفيديو.
إعداد توصيف الفيديو الأساسي
annotation_task_name: "Video Object Labeling"
data_files:
- data/videos.json
annotation_schemes:
- annotation_type: video_annotation
name: objects
description: "Label objects in video frames"
video_path: video
labels:
- name: person
- name: vehicle
- name: cyclistتنسيق بيانات العيّنة
يجب أن يحتوي ملف data/videos.json على مدخلات مع مسارات الفيديو:
[
{
"id": "video_001",
"video": "/path/to/video.mp4"
},
{
"id": "video_002",
"video": "/path/to/another_video.mp4"
}
]سير عمل التتبع اليدوي
بدون ميزات MOT المخصصة، لا يزال بإمكانك إجراء توصيف التتبع يدوياً:
إنشاء المسارات يدوياً
- انتقل إلى الإطار الذي يظهر فيه الجسم لأول مرة
- استخدم واجهة توصيف الفيديو لتوسيم الجسم
- ضمّن معرّفاً ثابتاً في توصيفك (مثل "person_1")
- انتقل إلى الإطارات التالية واستمر في التوسيم بنفس المعرّف
التعامل مع الحجب
عندما يصبح الجسم محجوباً:
- سجّل آخر إطار كان فيه الجسم مرئياً
- عندما يعاود الظهور، استخدم نفس المعرّف للحفاظ على استمرارية المسار
- وثّق فترات الحجب في ملاحظات التوصيف
ميزات MOT المقترحة
الميزات التالية ستعزز إمكانيات توصيف MOT في Potato ويتم النظر فيها للتطوير المستقبلي:
- تعيين تلقائي للمعرّفات: زيادة تلقائية للمعرّفات للأجسام الجديدة
- استيفاء المسار: استيفاء خطي أو تكعيبي بين الإطارات المفتاحية
- معالجة الحجب: مستويات الرؤية (مرئي، جزئي، كثيف، غير مرئي)
- تصوّر المسار: عرض مسارات الأجسام عبر الإطارات
- لوحة إدارة المسارات: دمج وتقسيم وإدارة معرّفات المسارات
- سمات لكل إطار: خصائص تتغير من إطار لآخر
إذا كنت مهتماً بهذه الميزات، يرجى التواصل مع فريق تطوير Potato أو المساهمة في المشروع.
نصائح لتوصيف MOT اليدوي
- اعمل على مقاطع قصيرة: من 100 إلى 200 إطار في كل مرة
- تسمية متسقة: استخدم مخطط معرّفات واضح (مثل "person_001"، "vehicle_023")
- وثّق عمليتك: احتفظ بملاحظات حول الحجب وقرارات المسار
- مراجعات متعددة: شاهد للأمام ثم للخلف لاكتشاف الأخطاء
- استخدم أدوات خارجية: فكّر في المعالجة المسبقة باستخدام نماذج الكشف
مناهج بديلة
للمشاريع التي تتطلب إمكانيات توصيف MOT كاملة:
- سير عمل هجين: استخدم Potato للتوسيم الأولي وأدوات MOT المتخصصة لإدارة المسارات
- التوصيف المسبق: شغّل كاشفات الأجسام لإنشاء مربعات إحاطة أولية، ثم صقّلها في Potato
- المعالجة اللاحقة: صدّر توصيفات Potato وطبّق خوارزميات التتبع خارجياً
الخطوات التالية
- تعرّف على توصيف إطارات الفيديو
- استكشف ميزات توصيف الصور
- اقرأ عن اتفاق المُوصِّفين لمراقبة الجودة
لتوثيق توصيف الفيديو الحالي، انظر /docs/features/image-annotation.