Potato في مؤتمر EMNLP 2022
تم قبول ورقتنا عن Potato في EMNLP 2022. تعرف على البحث وراء الأداة وكيفية الاستشهاد بها في عملك.
Potato في مؤتمر EMNLP 2022
نفتخر بالإعلان عن قبول ورقتنا التي تقدم Potato في مؤتمر EMNLP 2022، أحد أبرز المؤتمرات في معالجة اللغات الطبيعية. يمثل هذا الإنجاز سنوات من البحث والتطوير الهادف إلى جعل توصيف البيانات أكثر سهولة لمجتمع البحث.
الورقة البحثية
"Potato: The Portable Text Annotation Tool" تقدم فلسفة التصميم والبنية والقدرات لأداة Potato. توضح الورقة كيف يمكن لنهج الإعداد أولاً أن يقلل بشكل كبير من حاجز الدخول لإنشاء واجهات توصيف عالية الجودة.
المساهمات الرئيسية
-
تصميم الإعداد أولاً: نوضح كيف يمكن تحديد واجهات التوصيف المعقدة بالكامل من خلال إعدادات YAML، مما يلغي الحاجة لكتابة كود مخصص في معظم حالات الاستخدام.
-
مخططات توصيف مرنة: يدعم Potato مجموعة واسعة من أنواع التوصيف (أزرار الاختيار، مربعات التحقق، النطاقات، مقاييس Likert، والمزيد) التي يمكن دمجها لإنشاء مهام توصيف متطورة.
-
مراقبة جودة مدمجة: تصف الورقة نهجنا في إدارة جودة المُوصِّفين من خلال مراحل التدريب وفحوصات الانتباه ومراقبة اتفاق المُوصِّفين.
-
تكامل التعهيد الجماعي: نوضح التكامل السلس مع منصات مثل Prolific وAmazon Mechanical Turk لدراسات التوصيف واسعة النطاق.
الاستشهاد بـ Potato
إذا استخدمت Potato في بحثك، يرجى الاستشهاد بورقتنا:
@inproceedings{pei2022potato,
title={Potato: The Portable Text Annotation Tool},
author={Pei, Jiaxin and Anber, Aparna and Jurgens, David},
booktitle={Proceedings of the 2022 Conference on Empirical Methods
in Natural Language Processing: System Demonstrations},
pages={327--337},
year={2022}
}لماذا بنينا Potato
جاء الدافع لبناء Potato من إحباطاتنا كباحثين في معالجة اللغات الطبيعية. كل مشروع توصيف جديد كان يبدو أنه يتطلب إما:
- تعلم منصة توصيف معقدة بميزات لا نحتاجها
- بناء واجهات مخصصة من الصفر
- التنازل عن تجربة التوصيف بسبب قيود الأداة
أردنا أداة تكون:
- بسيطة: البدء في دقائق وليس أيام
- مرنة: تدعم أي مهمة توصيف يمكن تخيلها
- محمولة: تعمل في أي مكان بدون بنية تحتية معقدة
- ملائمة للبحث: مصممة لسير العمل الأكاديمي وقابلية إعادة الإنتاج
الأثر والتبني
منذ إصدارها، تم تبني Potato من قبل مجموعات بحثية حول العالم لمشاريع تشمل:
- تحليل المشاعر وكشف العواطف
- التعرف على الكيانات المسماة واستخراج العلاقات
- إشراف المحتوى وكشف السمّية
- تعدين الحجج وكشف المواقف
- معالجة اللغات الطبيعية السريرية وتعدين النصوص الطبية الحيوية
نظرة مستقبلية
كان نشر EMNLP مجرد البداية. منذ ذلك الحين، أضفنا:
- دعم توصيف الصور والصوت
- مساعدة التوصيف المدعومة بالذكاء الاصطناعي
- تكامل التعلم النشط
- ميزات تعاون محسّنة
نلتزم بمواصلة التطوير بناءً على ملاحظات المجتمع. إذا كان لديك طلبات ميزات أو أفكار، يرجى فتح مشكلة على مستودع GitHub.
شكر وتقدير
نشكر المُوصِّفين والمختبرين الأوائل والمتبنين الأوائل الذين ساعدوا في تشكيل Potato. شكر خاص لجامعة ميشيغان لدعم هذا البحث ولمراجعي EMNLP على ملاحظاتهم القيّمة.
اقرأ الورقة الكاملة على ACL Anthology أو شاهد فيديو العرض التوضيحي.