Productivity Features
Keyboard shortcuts, tooltips, keyword highlights, और label suggestions।
Productivity Features
Potato में annotators को तेज़ और अधिक सटीकता से काम करने में मदद करने के लिए कई features शामिल हैं, जिनमें keyboard shortcuts, tooltips, keyword highlights, और label suggestions शामिल हैं।
Keyboard Shortcuts
Sequential Keybindings
अधिकतम 10 options वाले annotation schemes के लिए, keybindings default रूप से sequentially assign किए जा सकते हैं:
annotation_schemes:
- annotation_type: radio
name: sentiment
labels: [positive, neutral, negative]
sequential_key_binding: trueपहला option "1" key से, दूसरा "2" से, और इसी प्रकार आगे correspond करेगा।
Custom Keybindings
अधिक नियंत्रण के लिए, प्रत्येक label पर custom keybindings configure करें:
annotation_schemes:
- annotation_type: multiselect
labels:
- name: "Option 1"
key_value: "1"
- name: "Option 2"
key_value: "2"
- name: "Skip"
key_value: "s"Admin Keyword Highlights
Matching text के चारों ओर colored highlights के साथ annotators को relevant words और phrases की पहचान करने में मदद करें।
कॉन्फ़िगरेशन
keyword_highlights_file: data/keywords.tsvTSV File Format
Keywords file tab-separated होनी चाहिए जिसमें तीन columns हों:
Word Label Schema
love positive sentiment
hate negative sentiment
excel* positive sentiment
disappoint* negative sentiment
| Column | विवरण |
|---|---|
| Word | Highlight करने के लिए Keyword या phrase (* wildcards का समर्थन करता है) |
| Label | इस keyword से जुड़ा Annotation label |
| Schema | Annotation schema नाम |
Matching व्यवहार
- Case-insensitive: "Love" "love", "LOVE", "Love" से match करता है
- Word boundaries: "love" "love" से match करता है लेकिन "lovely" से नहीं (wildcards का उपयोग किए बिना)
- Wildcards: Prefix/suffix matching के लिए
*का उपयोग करें:excel*"excellent", "excels", "excel" से match करता है*happy"unhappy", "happy" से match करता है
Colors Configure करना
Colors ui.spans.span_colors section में configure किए जाते हैं:
ui:
spans:
span_colors:
sentiment:
positive: "(34, 197, 94)" # Green
negative: "(239, 68, 68)" # Red
neutral: "(156, 163, 175)" # GrayRandomization Settings
शोध उद्देश्यों के लिए, annotators को केवल highlights पर निर्भर होने से रोकने के लिए keyword highlight randomization configure करें:
keyword_highlights_file: data/keywords.tsv
keyword_highlight_settings:
keyword_probability: 1.0 # Show 100% of keywords (0.0-1.0)
random_word_probability: 0.05 # Highlight 5% random words as distractors
random_word_label: "distractor"
random_word_schema: "keyword"प्रमुख विशेषताएँ:
- Persistence: Highlighted words प्रति user+instance cache किए जाते हैं
- Deterministic randomization: Seed के रूप में username + instance_id का hash उपयोग करता है
- Behavioral tracking: कौन से words highlight किए गए, यह record करता है
Tooltips
प्रत्येक response option के लिए विस्तृत स्पष्टीकरण जोड़ें:
Plaintext Tooltips
annotation_schemes:
- annotation_type: multiselect
name: "Question"
labels:
- name: "Label 1"
tooltip: "This option means..."HTML Tooltips
Formatted tooltips के लिए, एक HTML file की ओर point करें:
annotation_schemes:
- annotation_type: multiselect
name: "Question"
labels:
- name: "Label 1"
tooltip_file: "config/tooltips/label1_tooltip.html"Label Suggestions
दो modes के साथ annotators की मदद के लिए suggestions प्रदर्शित करें:
highlight: Suggested labels को color से highlight करेंprefill: Suggested labels को स्वचालित रूप से pre-select करें
कॉन्फ़िगरेशन
annotation_schemes:
- annotation_type: multiselect
name: "sentiment"
description: "What sentiment does the text express?"
labels: [positive, neutral, negative]
label_suggestions: "highlight" # or "prefill"
- annotation_type: text
name: "explanation"
description: "Why do you think so?"
multiline: true
rows: 2
label_suggestions: "prefill"Data Format
अपने data items में suggestions शामिल करें:
{
"id": "1",
"text": "Good Job!",
"label_suggestions": {
"sentiment": "positive",
"explanation": "Because I think "
}
}Automatic Task Assignment
विभिन्न annotators को annotation tasks आसानी से assign करें:
automatic_assignment:
on: true
output_filename: "task_assignment.json"
sampling_strategy: "random"
labels_per_instance: 10
instance_per_annotator: 50
test_question_per_annotator: 2Active Learning एकीकरण
Productivity features सबसे अधिक informative instances को प्राथमिकता देने के लिए Active Learning के साथ integrate होते हैं:
active_learning:
enabled: true
schema_names: ["sentiment"]
min_annotations_per_instance: 2
min_instances_for_training: 20
update_frequency: 10सर्वोत्तम प्रथाएँ
- High-volume tasks के लिए keyboard shortcuts का उपयोग करें - वे annotation को significantly तेज़ करते हैं
- जटिल या ambiguous labels के लिए tooltips जोड़ें - inconsistency कम करने के लिए
- Relevant text पर ध्यान आकर्षित करने के लिए keyword highlights का उपयोग करें, लेकिन research validity के लिए randomization पर विचार करें
- Suggestions को सावधानी से pre-fill करें - अत्यधिक उपयोग से annotators biased हो सकते हैं
आगे पढ़ें
- UI Configuration - Interface customize करें
- Active Learning - ML-based prioritization
- Task Assignment - Assignment strategies configure करें
कार्यान्वयन विवरण के लिए, source documentation देखें।