Aufgabenzuweisung
Steuern, wie Annotationsinstanzen auf Annotatoren verteilt werden.
Aufgabenzuweisung
Potato bietet flexible Aufgabenzuweisungsstrategien, um zu steuern, wie Annotationsinstanzen auf Annotatoren verteilt werden.
Übersicht
Die Aufgabenzuweisung steuert:
- Welche Elemente jeder Annotator sieht
- Wie viele Elemente jeder Annotator abschließt
- Wie viele Annotationen jedes Element erhält
- Die Reihenfolge, in der Elemente präsentiert werden
Wichtige Konfigurationsoptionen
| Option | Beschreibung | Standard |
|---|---|---|
assignment_strategy | Strategie zur Zuweisung von Elementen | random |
max_annotations_per_user | Maximale Elemente pro Annotator | unbegrenzt |
max_annotations_per_item | Zielannotationen pro Element | 3 |
Zuweisungsstrategien
Zufällige Zuweisung
Elemente werden zufällig an Annotatoren zugewiesen und eine unvoreingenommene Verteilung gewährleistet.
assignment_strategy: random
max_annotations_per_item: 3Geeignet für: Allgemeine Annotationsaufgaben, bei denen die Reihenfolge keine Rolle spielt.
Feste Reihenfolge
Elemente werden in der Reihenfolge zugewiesen, in der sie im Datensatz erscheinen.
assignment_strategy: fixed_order
max_annotations_per_item: 2Geeignet für: Aufgaben, bei denen Annotatoren Elemente in einer bestimmten Reihenfolge sehen sollen.
Am-wenigsten-annotiert-Zuweisung
Priorisiert Elemente mit den wenigsten vorhandenen Annotationen und gewährleistet eine gleichmäßige Verteilung.
assignment_strategy: least_annotated
max_annotations_per_item: 5Geeignet für: Sicherstellen, dass alle Elemente ausreichend abgedeckt werden, bevor eines übermäßig viele Annotationen erhält.
Max-Diversity-Zuweisung
Priorisiert Elemente mit der höchsten Uneinigkeit unter vorhandenen Annotationen.
assignment_strategy: max_diversity
max_annotations_per_item: 4Geeignet für: Qualitätskontrolle und Klärung mehrdeutiger Elemente.
Active-Learning-Zuweisung
Verwendet maschinelles Lernen, um unsichere Instanzen zu priorisieren.
assignment_strategy: active_learning
active_learning:
enabled: true
schema_names: ["sentiment"]
min_annotations_per_instance: 2
min_instances_for_training: 20
update_frequency: 10Vollständige Konfiguration unter Active Learning.
Konfiguration
Moderne Konfiguration (empfohlen)
# Strategy selection
assignment_strategy: random
# Limits
max_annotations_per_user: 10 # -1 for unlimited
max_annotations_per_item: 3 # -1 for unlimited
# Optional: nested configuration
assignment:
strategy: random
max_annotations_per_item: 3
random_seed: 1234Legacy-Konfiguration
Die ältere automatic_assignment-Konfiguration wird weiterhin unterstützt:
automatic_assignment:
on: true
output_filename: task_assignment.json
sampling_strategy: random # 'random' or 'ordered'
labels_per_instance: 3 # Annotations per item
instance_per_annotator: 5 # Items per annotator
test_question_per_annotator: 0Testfragen
Aufmerksamkeitscheck-Fragen in die Annotationswarteschlange einfügen:
Testfragen definieren
_testing zur Instanz-ID in Ihrer Datendatei hinzufügen:
text,id
"This is test question 1",0_testing
"Regular item",dkjfdOder in JSON:
[
{"id": "0_testing", "text": "This is a test question"},
{"id": "regular_001", "text": "Normal annotation item"}
]Konfiguration
automatic_assignment:
on: true
test_question_per_annotator: 2 # Insert 2 test questions per annotatorBeispielkonfigurationen
Einfache zufällige Zuweisung
annotation_task_name: "Sentiment Analysis"
assignment_strategy: random
max_annotations_per_user: 20
max_annotations_per_item: 3Qualitätsorientierte Zuweisung
annotation_task_name: "Quality Annotation"
assignment_strategy: max_diversity
max_annotations_per_item: 5
max_annotations_per_user: 50Crowdsourcing-Einrichtung
annotation_task_name: "Crowdsourced Task"
assignment_strategy: random
max_annotations_per_user: 10
max_annotations_per_item: 3
# Crowdsourcing settings
hide_navbar: true
jumping_to_id_disabled: true
login:
type: url_direct
url_argument: workerIdActive-Learning-Einrichtung
assignment_strategy: active_learning
active_learning:
enabled: true
schema_names: ["sentiment", "topic"]
min_annotations_per_instance: 2
min_instances_for_training: 20
update_frequency: 10
classifier_name: "sklearn.linear_model.LogisticRegression"
vectorizer_name: "sklearn.feature_extraction.text.TfidfVectorizer"Admin-Dashboard-Integration
Zuweisungseinstellungen über das Admin-Dashboard überwachen und anpassen:
- Navigieren Sie zu
/admin - Gehen Sie zum Tab Konfiguration
- Ändern Sie:
- Max. Annotationen pro Nutzer
- Max. Annotationen pro Element
- Zuweisungsstrategie
Änderungen werden ohne Serverneustart sofort wirksam.
Weiterführende Informationen
- Active Learning – ML-basierte Zuweisungspriorisierung
- Qualitätskontrolle – Aufmerksamkeitschecks und Gold-Standards
- Kategoriezuweisung – Elemente nach Annotator-Expertise weiterleiten
- Crowdsourcing-Integration – MTurk- und Prolific-Integration
Implementierungsdetails finden Sie in der Quelldokumentation.