新機能
Potato v2.xリリースにおける新機能と改善点の概要。
新機能
このページでは、Potato v2.xリリース全体の新機能と改善点について説明します。
Potato 2.2.0
2026年2月20日リリース
Potato 2.2は、9つの新しいアノテーションスキーマ、プラグイン可能なエクスポートシステム、MACE能力推定、55の検証済みアンケート、リモートデータソースを含む主要な機能リリースです。
新しいアノテーションスキーマ(9種類)
イベントアノテーション — トリガースパンと型付き引数ロールを持つN項イベント構造。ATTACK、HIRE、TRAVELなどのイベントに制約付きエンティティ引数とハブスポーク型アーク可視化でアノテーションできます。
annotation_schemes:
- annotation_type: event_annotation
name: events
span_schema: entities
event_types:
- type: "ATTACK"
trigger_labels: ["EVENT_TRIGGER"]
arguments:
- role: "attacker"
entity_types: ["PERSON", "ORGANIZATION"]
required: trueエンティティリンキング — スパンアノテーションを外部知識ベース(Wikidata、UMLS、カスタムREST API)にリンクします。任意のスパンスキーマにentity_linking:ブロックを追加して、KB検索とリンキングを有効にします。
トリアージ — 高速データスクリーニングのためのProdigyスタイルの承認/却下/スキップインターフェース。カスタマイズ可能なラベル、キーボードショートカット、高スループットアノテーションのための自動進行機能があります。
ペアワイズ比較 — バイナリ(好みのタイルをクリック)またはスケール(スライダー)モードで2つのアイテムを比較します。items_key、allow_tie、設定可能な範囲を持つscale:ブロックをサポートします。
会話ツリー — ノードごとの評価、パス選択、ブランチ比較による階層的な会話構造のアノテーション。
共参照チェーン — 視覚的インジケーター付きで共参照するテキストメンションをチェーンにグループ化します。エンティティタイプ、シングルトン制御、複数のハイライトモードをサポートします。
セグメンテーションマスク — ピクセルレベルの画像セグメンテーション用の新しいfill、eraser、brushツール。
PDF/ドキュメント用バウンディングボックス — ドキュメントアノテーションタスク用にPDFページ上にボックスを描画。
非連続スパン — allow_discontinuous: trueで、非連続のテキストセグメントを単一のスパンとして選択可能に。
インテリジェントアノテーション
MACE能力推定 — 真のラベルとアノテーター能力スコア(0.0-1.0)を同時に推定する変分ベイズEMアルゴリズム。radio、likert、select、multiselectスキーマで動作します。
mace:
enabled: true
trigger_every_n: 10
min_annotations_per_item: 3オプションハイライト — 離散アノテーションタスクの正解候補をLLMベースでハイライト。スターインジケーターでトップkオプションをハイライトし、可能性の低いオプションを暗くします。
ai_support:
option_highlighting:
enabled: true
top_k: 3
dim_opacity: 0.4多様性順序付け — 埋め込みベースのクラスタリングとラウンドロビンサンプリングにより、アノテーターが類似アイテムの連続ではなく多様なコンテンツを見ることを保証します。
assignment_strategy: diversity_clustering
diversity_ordering:
enabled: true
prefill_count: 100エクスポートシステム
新しいプラグイン可能なエクスポートCLI(python -m potato.export)がアノテーションを6つの業界標準形式に変換します:COCO、YOLO、Pascal VOC、CoNLL-2003、CoNLL-U、セグメンテーションマスク。
python -m potato.export --config config.yaml --format coco --output ./export/リモートデータソース
URL、S3、Google Drive、Dropbox、Hugging Face、Google Sheets、SQLデータベースから新しいdata_sources:設定ブロック経由でアノテーションデータを読み込みます。部分読み込み、キャッシュ、認証情報管理を含みます。
アンケート
8カテゴリ(性格、メンタルヘルス、感情、自己概念、社会的態度、回答スタイル、短縮版、デモグラフィック)にわたる55の検証済みアンケート。instrument: "tipi"で事前/事後調査フェーズに使用できます。
その他の改善
- キーフレーム補間によるビデオオブジェクトトラッキング
- 外部AI設定ファイルのサポート
- フォームレイアウトのグリッド改善
- PDF、Word、コード、スプレッドシートのフォーマットハンドラー
Potato 2.1.0
2026年2月5日リリース
Potato 2.1では、インスタンス表示システム、ビジュアルAIサポート、スパンリンキング、マルチフィールドスパンアノテーション、レイアウトカスタマイズが導入されました。
インスタンス表示システム
コンテンツ表示をアノテーションから分離する新しいinstance_display設定ブロック。画像、ビデオ、オーディオ、テキスト、対話の任意の組み合わせを任意のアノテーションスキームとともに表示できます。
instance_display:
fields:
- key: image_url
type: image
display_options:
max_width: 600
zoomable: true
- key: description
type: text
annotation_schemes:
- annotation_type: radio
name: category
labels: [nature, urban, people]text、html、image、video、audio、dialogue、pairwise、code、spreadsheet、document、pdfを含む11の表示タイプをサポートします。
マルチフィールドスパンアノテーション
スパンアノテーションスキームがtarget_fieldオプションをサポートし、同じインスタンス内の複数のテキストフィールドにまたがってアノテーションできるようになりました。
annotation_schemes:
- annotation_type: span
name: source_entities
target_field: "source_text"
labels: [PERSON, ORGANIZATION]
- annotation_type: span
name: summary_entities
target_field: "summary"
labels: [PERSON, ORGANIZATION]スパンリンキング
アノテーション済みスパン間の型付き関係を作成するための新しいspan_linkアノテーションタイプ。有向・無向リンク、N項関係、視覚的アーク表示、ラベル制約をサポートします。
annotation_schemes:
- annotation_type: span
name: entities
labels:
- name: "PERSON"
color: "#3b82f6"
- name: "ORGANIZATION"
color: "#22c55e"
- annotation_type: span_link
name: relations
span_schema: entities
link_types:
- name: "WORKS_FOR"
directed: true
allowed_source_labels: ["PERSON"]
allowed_target_labels: ["ORGANIZATION"]
color: "#dc2626"ビジュアルAIサポート
画像およびビデオアノテーション支援のための4つの新しいビジョンエンドポイント:
- YOLO — 高速ローカルオブジェクト検出
- Ollama Vision — ローカルビジョン言語モデル(LLaVA、Qwen-VL)
- OpenAI Vision — GPT-4oクラウドビジョン
- Anthropic Vision — Claudeのビジョン機能
オブジェクト検出、事前アノテーション、分類、ヒント、シーン検出、キーフレーム検出、オブジェクトトラッキングを含みます。
レイアウトカスタマイズ
HTMLテンプレートとCSSを使用した高度なカスタムビジュアルレイアウトの作成。Potatoは編集可能なレイアウトファイルを生成します。また、グリッドレイアウト、色分けされたオプション、セクションスタイリングを含む完全なカスタムテンプレートを提供することもできます。
task_layout: layouts/custom_task_layout.htmlコンテンツモデレーション、対話QA、医療レビューの3つのレイアウト例が含まれています。
ラベル根拠
各ラベルが適用される理由についてバランスの取れた説明を生成する4番目のAI機能。アノテーターがさまざまな分類の観点を理解するのに役立ちます。
ai_support:
features:
rationales:
enabled: trueその他の改善
- 信頼性向上のための50以上の新しいテスト
- レスポンシブデザインの改善
- レイアウト例を含むプロジェクトハブの組織強化
- アノテーションタイプ全体のバグ修正
v2.0とv2.1の比較
| 機能 | v2.0 | v2.1 |
|---|---|---|
| インスタンス表示 | アノテーションのハックで対応 | 専用のinstance_displayブロック |
| スパンターゲット | 単一テキストフィールド | target_fieldでマルチフィールド |
| スパンリンキング | 利用不可 | 完全なspan_linkタイプ |
| ビジュアルAI | 利用不可 | YOLO、Ollama Vision、OpenAI Vision、Anthropic Vision |
| レイアウトカスタマイズ | 基本的な自動生成 | 自動生成+カスタムテンプレート |
| AI機能 | 3つ(ヒント、キーワード、提案) | 4つ(+根拠) |
Potato 2.0
Potato 2.0は、インテリジェントでスケーラブルなアノテーションのための強力な新機能を導入するメジャーリリースです。このセクションでは、主な追加機能と改善点を紹介します。
AIサポート
大規模言語モデルを統合して、インテリジェントなヒント、キーワードハイライト、ラベル提案でアノテーターを支援します。
サポートされるプロバイダー:
- OpenAI (GPT-4, GPT-3.5)
- Anthropic (Claude 3, Claude 3.5)
- Google (Gemini)
- Ollama(ローカルモデル)
- vLLM(セルフホスト)
ai_support:
enabled: true
endpoint_type: openai
ai_config:
model: gpt-4
api_key: ${OPENAI_API_KEY}
features:
hints:
enabled: true
label_suggestions:
enabled: trueオーディオアノテーション
Peaks.jsを利用した波形可視化による本格的なオーディオアノテーション。セグメントの作成、時間領域のラベル付け、キーボードショートカットによる音声アノテーションが可能です。
主な機能:
- 波形可視化
- セグメントの作成とラベリング
- セグメントごとのアノテーション質問
- 15以上のキーボードショートカット
- サーバーサイドの波形キャッシュ
annotation_schemes:
- annotation_type: audio
name: speakers
mode: label
labels:
- Speaker A
- Speaker Bアクティブラーニング
モデルの不確実性に基づいてアノテーションインスタンスを自動的に優先順位付けします。既存のアノテーションで分類器を訓練し、最も有益な例にアノテーターを集中させます。
機能:
- 複数の分類器オプション(LogisticRegression、RandomForest、SVC、MultinomialNB)
- さまざまなベクタライザー(TF-IDF、Count、Hashing)
- 再起動時のモデル永続化
- LLM強化選択
- マルチスキーマサポート
active_learning:
enabled: true
schema_names:
- sentiment
min_instances_for_training: 30
update_frequency: 50
classifier:
type: LogisticRegressionトレーニングフェーズ
メインタスクの前に練習問題でアノテーターの資格を確認します。即時フィードバックを提供し、設定可能な合格基準で品質を確保します。
機能:
- 既知の回答を持つ練習問題
- 即時フィードバックと説明
- 設定可能な合格基準
- リトライオプション
- 管理ダッシュボードでの進捗追跡
phases:
training:
enabled: true
data_file: "data/training.json"
passing_criteria:
min_correct: 8
total_questions: 10強化された管理ダッシュボード
アノテーションタスクの包括的なモニタリングと管理インターフェース。
ダッシュボードタブ:
- 概要: 高レベルメトリクスと完了率
- アノテーター: パフォーマンス追跡、タイミング分析
- インスタンス: 不一致スコア付きデータ閲覧
- 設定: リアルタイム設定調整
admin_api_key: ${ADMIN_API_KEY}データベースバックエンド
コネクションプーリングとトランザクションサポートを備えた大規模デプロイメント向けMySQLサポート。
database:
type: mysql
host: localhost
database: potato_db
user: ${DB_USER}
password: ${DB_PASSWORD}Potatoは初回起動時に必要なテーブルを自動的に作成します。
アノテーション履歴
タイムスタンプ、ユーザーID、アクションタイプを含むすべてのアノテーション変更の完全な追跡。監査と行動分析が可能になります。
{
"history": [
{
"timestamp": "2024-01-15T10:30:00Z",
"user": "annotator_1",
"action": "create",
"schema": "sentiment",
"value": "Positive"
}
]
}マルチフェーズワークフロー
複数の順次フェーズを持つ複雑なアノテーションワークフローの構築:
- 同意 - インフォームドコンセントの収集
- 事前調査 - デモグラフィックとスクリーニング
- 指示 - タスクガイドライン
- トレーニング - 練習問題
- アノテーション - メインタスク
- 事後調査 - フィードバック調査
phases:
consent:
enabled: true
data_file: "data/consent.json"
prestudy:
enabled: true
data_file: "data/demographics.json"
training:
enabled: true
data_file: "data/training.json"
poststudy:
enabled: true
data_file: "data/feedback.json"v2.0設定の変更
新しい設定構造
Potato 2.0ではよりクリーンな設定形式を使用します:
v1(旧):
data_files:
- data.json
id_key: id
text_key: text
output_file: annotations.jsonv2(新):
data_files:
- "data/data.json"
item_properties:
id_key: id
text_key: text
output_annotation_dir: "output/"
output_annotation_format: "json"セキュリティ要件
設定ファイルはtask_dir内に配置する必要があります:
# Valid - config.yaml is in the project directory
task_dir: "."
# Valid - config in configs/ subdirectory
task_dir: "my_project/"クイック比較
| 機能 | v1 | v2.0 | v2.1 | v2.2 |
|---|---|---|---|---|
| AI/LLMサポート | なし | あり | あり+ビジュアルAI+根拠 | +オプションハイライト |
| オーディオアノテーション | 基本 | 完全な波形 | 完全な波形 | 完全な波形 |
| アクティブラーニング | なし | あり | あり | あり+多様性順序付け |
| インスタンス表示 | なし | なし | あり | あり |
| スパンリンキング | なし | なし | あり | あり |
| イベントアノテーション | なし | なし | なし | あり |
| エンティティリンキング | なし | なし | なし | あり |
| ペアワイズ/トリアージ/共参照/ツリー | なし | なし | なし | あり |
| レイアウトカスタマイズ | なし | 自動生成 | 自動+カスタムテンプレート | 自動+カスタムテンプレート |
| トレーニングフェーズ | なし | あり | あり | あり |
| 管理ダッシュボード | 基本 | 強化 | 強化 | 強化+MACE |
| データベースバックエンド | ファイルのみ | ファイル+MySQL | ファイル+MySQL | ファイル+MySQL |
| エクスポートCLI | なし | なし | なし | あり(COCO、YOLO、CoNLLなど) |
| アンケート | なし | なし | なし | 55の検証済みアンケート |
| リモートデータソース | なし | なし | なし | S3、GDrive、HuggingFaceなど |
移行ガイド
設定の更新(v1からv2へ)
-
データ設定
yaml# Old id_key: id text_key: text # New item_properties: id_key: id text_key: text -
出力設定
yaml# Old output_file: annotations.json # New output_annotation_dir: "output/" output_annotation_format: "json" -
設定ファイルの場所 設定ファイルがプロジェクトディレクトリ内にあることを確認してください。
サーバーの起動
# v2 command
python -m potato start config.yaml -p 8000
# Or shorthand
potato start config.yamlはじめに
Potatoを試す準備はできましたか?クイックスタートガイドから始めるか、特定の機能を探索してください:
v2.2の機能:
- イベントアノテーション - N項イベント構造
- エンティティリンキング - 知識ベースリンキング
- トリアージ - 高速データスクリーニング
- 共参照チェーン - エンティティ共参照
- 会話ツリー - 階層的対話アノテーション
- MACE - アノテーター能力推定
- オプションハイライト - AI支援オプションガイダンス
- 多様性順序付け - 埋め込みベースのアイテム順序付け
- エクスポート形式 - 6形式対応エクスポートCLI
- リモートデータソース - クラウドデータ読み込み
- アンケート - 55の検証済みアンケート
v2.1の機能:
- インスタンス表示 - マルチモーダルコンテンツ表示
- ビジュアルAIサポート - 画像・ビデオアノテーション用AI
- スパンリンキング - エンティティ関係アノテーション
コア機能:
- AIサポート - インテリジェントアノテーション支援
- アクティブラーニング - スマートなインスタンス優先順位付け
- オーディオアノテーション - 波形ベースのアノテーション
- トレーニングフェーズ - アノテーターの資格確認
- 管理ダッシュボード - モニタリングと管理