Kategoriezuweisung
Annotationselemente basierend auf nachgewiesener Expertise an Annotatoren weiterleiten.
Kategoriebasierte Zuweisung
Die kategoriebasierte Zuweisung ordnet Annotatoren automatisch Annotationsinstanzen basierend auf ihrer nachgewiesenen Expertise zu. Annotatoren werden in den Trainingsphasen anhand kategorienspezifischer Fragen bewertet und erhalten nur Instanzen aus Kategorien, für die sie qualifiziert sind.
Übersicht
Das kategoriebasierte Zuweisungssystem funktioniert wie folgt:
- Daten-Tagging: Instanzen in Ihren Datendateien werden mit Kategorien versehen
- Trainingsbewertung: Trainingsfragen werden ebenfalls mit Kategorien versehen
- Leistungsverfolgung: Das System verfolgt die Genauigkeit pro Kategorie während des Trainings
- Qualifizierung: Nutzer, die den Schwellenwert erreichen, sind "qualifiziert"
- Zuweisung: Nutzer erhalten nur Instanzen aus ihren qualifizierten Kategorien
Konfiguration
Grundeinrichtung
# Enable category-based assignment strategy
assignment_strategy: category_based
# Configure category key in item_properties
item_properties:
id_key: id
text_key: text
category_key: category # Field containing category
# Category assignment settings
category_assignment:
enabled: true
qualification:
source: training # Where qualification comes from
threshold: 0.7 # 70% accuracy required
min_questions: 2 # At least 2 questions per category
fallback: uncategorized # What to do if user qualifies for nothingKonfigurationsoptionen
| Option | Typ | Standard | Beschreibung |
|---|---|---|---|
enabled | boolean | true | Kategoriezuweisung aktivieren/deaktivieren |
qualification.source | string | "training" | Quelle: "training", "prestudy" oder "both" |
qualification.threshold | float | 0.7 | Mindestgenauigkeit (0,0–1,0) zur Qualifizierung |
qualification.min_questions | integer | 1 | Mindestfragen pro Kategorie |
fallback | string | "uncategorized" | Verhalten, wenn Nutzer sich nicht qualifiziert |
Fallback-Optionen
uncategorized: Instanzen ohne Kategorie zuweisenrandom: Zufällig aus allen verbleibenden Instanzen zuweisennone: Keine Instanzen zuweisen
Datenformat
Instanzdaten
Das Kategorienfeld in Ihren Datendateien einfügen:
{"id": "econ_001", "text": "Market analysis...", "category": "economics"}
{"id": "sci_001", "text": "Research findings...", "category": "science"}
{"id": "multi_001", "text": "Interdisciplinary...", "category": ["economics", "science"]}
{"id": "general_001", "text": "General content...", "category": null}Trainingsdaten
Trainingsinstanzen sollten Kategorien enthalten:
{
"training_instances": [
{
"id": "train_econ_1",
"text": "Question about economic concepts...",
"category": "economics",
"correct_answers": {"topic": "Economics"},
"explanation": "This is an economics topic because..."
}
]
}Qualifizierungsprozess
Während des Trainings
Wenn Nutzer Trainingsfragen beantworten:
- Das System erfasst die Kategorie jeder Frage
- Für jede Kategorie wird verfolgt:
- Gesamte beantwortete Fragen
- Anzahl richtiger Antworten
- Genauigkeit (richtig / gesamt)
Nach dem Training
Wenn ein Nutzer das Training besteht:
- Genauigkeit wird für jede Kategorie berechnet
- Kategorien, die sowohl den Schwellenwert als auch die Mindestfragenanzahl erfüllen, werden zu "qualifizierten Kategorien" hinzugefügt
- Qualifizierungen bleiben für die Sitzung bestehen
Beispiel
Bei einem Schwellenwert von 0,7 (70 %) und min_questions von 2:
| Kategorie | Fragen | Richtig | Genauigkeit | Qualifiziert? |
|---|---|---|---|---|
| Wirtschaft | 3 | 3 | 100 % | Ja |
| Wissenschaft | 2 | 1 | 50 % | Nein (unter Schwellenwert) |
| Sport | 1 | 1 | 100 % | Nein (unter Mindestfragen) |
Nutzer würde nur „Wirtschaft"-Instanzen erhalten.
Anwendungsfälle
Expertenweiterleitng
Spezialisierte Inhalte an qualifizierte Annotatoren weiterleiten:
- Medizinische Texte an Annotatoren mit medizinischen Kenntnissen
- Rechtliche Dokumente an Personen mit Rechtskenntnissen
- Technische Inhalte an technisch versierte Personen
Qualitätskontrolle
Qualität sicherstellen, indem Inhalte nur qualifizierten Personen zugewiesen werden:
- Annotatoren müssen vor der eigentlichen Arbeit Kompetenz nachweisen
- Unterschiedliche Qualitätsschwellenwerte für verschiedene Inhaltstypen
Arbeitsverteilung
Arbeit basierend auf Expertise verteilen:
- Hochkomplexe Elemente an Experten-Annotatoren
- Allgemeine Elemente an alle Annotatoren
Dynamischer Expertise-Modus
Der dynamische Expertise-Modus ermöglicht eine spontane Bewertung während der Annotation ohne Gold-gelabelte Trainingsdaten:
category_assignment:
enabled: true
dynamic:
enabled: true
agreement_method: majority_vote
min_annotations_for_consensus: 2
learning_rate: 0.1
update_interval_seconds: 60
base_probability: 0.1Funktionsweise des dynamischen Modus
- Ausgangszustand: Alle Annotatoren starten mit neutraler Expertise (0,5) für alle Kategorien
- Probabilistische Zuweisung: Kategorien mit höherer Expertise haben höhere Zuweisungswahrscheinlichkeit
- Hintergrundverarbeitung: Berechnet periodisch Konsens und aktualisiert Expertise-Werte
- Expertise-Aktualisierungen: Werte steigen bei Übereinstimmung mit dem Konsens, fallen bei Abweichung
Konfigurationsoptionen
| Option | Typ | Standard | Beschreibung |
|---|---|---|---|
agreement_method | string | "majority_vote" | Wie der Konsens berechnet wird |
min_annotations_for_consensus | integer | 2 | Mindestannotationen vor der Berechnung |
learning_rate | float | 0,1 | Wie schnell sich Expertise-Werte ändern |
base_probability | float | 0,1 | Minimale Wahrscheinlichkeit für jede Kategorie |
API-Referenz
TrainingState-Methoden
# Record an answer for category tracking
training_state.record_category_answer(categories=['economics'], is_correct=True)
# Get score for a specific category
score = training_state.get_category_score('economics')
# Returns: {'correct': 3, 'total': 4, 'accuracy': 0.75}
# Get qualified categories based on threshold
qualified = training_state.get_qualified_categories(threshold=0.7, min_questions=2)UserState-Methoden
# Add a qualified category
user_state.add_qualified_category('economics', score=0.85)
# Check if user is qualified for a category
is_qualified = user_state.is_qualified_for_category('economics')
# Get all qualified categories
categories = user_state.get_qualified_categories()Fehlerbehebung
Nutzer erhalten keine Instanzen zugewiesen
- Prüfen, ob der Nutzer qualifizierte Kategorien hat (Trainingsleistung überprüfen)
- Gibt es Instanzen in diesen Kategorien, die noch nicht annotiert wurden?
- Ist
fallbackangemessen gesetzt?
Kategorien werden nicht verfolgt
- Sicherstellen, dass
category_keyinitem_propertiesgesetzt ist - Trainingsinstanzen haben das
category-Feld category_assignment.enabledisttrue
Weiterführende Informationen
- Aufgabenzuweisung – Allgemeine Zuweisungsstrategien
- Trainingsphase – Trainingskonfiguration
- Qualitätskontrolle – Aufmerksamkeitschecks und Gold-Standards
Implementierungsdetails finden Sie in der Quelldokumentation.