トリアージ
迅速なデータスクリーニングとフィルタリングのための承認/拒否/スキップインターフェース。
トリアージ
トリアージアノテーションスキーマは、迅速なデータキュレーションタスクに最適化されたProdigyスタイルのバイナリ承認/拒否/スキップインターフェースを提供します。このスキーマは、大規模データセットのフィルタリング、データ品質チェック、または素早いバイナリ判断を必要とするあらゆるタスクに最適です。
概要
トリアージスキーマは3つの大きく視覚的に区別されたボタンを表示します:
- Keep(緑)- 含めるアイテムを承認
- Discard(赤)- アイテムを拒否
- Unsure(灰色)- 不確かな場合にスキップ
自動進行が有効(デフォルト)な場合、アノテーターはキーボードショートカットだけで1時間あたり数百のアイテムを処理できます。
クイックスタート
yaml
annotation_schemes:
- annotation_type: triage
name: data_quality
description: Is this data sample suitable for training?
auto_advance: true
show_progress: true設定オプション
| フィールド | タイプ | デフォルト | 説明 |
|---|---|---|---|
annotation_type | string | 必須 | "triage"でなければならない |
name | string | 必須 | このスキーマの一意識別子 |
description | string | 必須 | アノテーターに表示される指示 |
accept_label | string | "Keep" | 承認ボタンのテキストラベル |
reject_label | string | "Discard" | 拒否ボタンのテキストラベル |
skip_label | string | "Unsure" | スキップボタンのテキストラベル |
auto_advance | boolean | true | 選択後に次のアイテムに自動的に移動 |
show_progress | boolean | true | トリアージウィジェットにプログレスバーを表示 |
accept_key | string | "1" | 承認のキーボードショートカット |
reject_key | string | "2" | 拒否のキーボードショートカット |
skip_key | string | "3" | スキップのキーボードショートカット |
例
データ品質フィルタリング
yaml
annotation_schemes:
- annotation_type: triage
name: quality_filter
description: Is this text high quality and suitable for training?
auto_advance: trueコンテンツモデレーション
yaml
annotation_schemes:
- annotation_type: triage
name: content_moderation
description: Does this content violate community guidelines?
accept_label: "Safe"
reject_label: "Violates"
skip_label: "Review Later"
auto_advance: true関連性フィルタリング
yaml
annotation_schemes:
- annotation_type: triage
name: relevance
description: Is this document relevant to the query?
accept_label: "Relevant"
reject_label: "Not Relevant"
skip_label: "Partially Relevant"他のスキーマとの組み合わせ
トリアージは他のアノテーションタイプと組み合わせて、フィルタリングと詳細なアノテーションの両方に使用できます:
yaml
annotation_schemes:
- annotation_type: triage
name: include_item
description: Should this item be included in the dataset?
auto_advance: false # Don't auto-advance when combined
- annotation_type: radio
name: category
description: What category does this belong to?
labels: ["News", "Opinion", "Review", "Other"]キーボードショートカット
| キー | アクション |
|---|---|
1 | Keep(承認) |
2 | Discard(拒否) |
3 | Unsure(スキップ) |
キー1、2、3はキーボード上で隣り合っているため、キーボードを見ずに高速アノテーションが可能です。
出力形式
json
{
"data_quality": {
"labels": {
"decision": "accept"
}
}
}可能な値:"accept"、"reject"、"skip"。
ベストプラクティス
- 高スループットタスクには自動進行を使用 - シンプルな判断のスループットを大幅に向上
- 複雑な判断には自動進行を無効化 - アノテーターが考える時間や追加のアノテーションが必要な場合
- 明確な説明を提供 - 一貫したアノテーションのためにトリアージ基準を明確にする
- 意味のあるラベルを使用 - 特定のユースケースに合わせてラベルをカスタマイズ
- 注意チェックと組み合わせ - クラウドソーシングでは、品質確認のために既知のアイテムを挿入
関連資料
実装の詳細については、ソースドキュメントを参照してください。