Skip to content

新機能

Potato v2.xリリースにおける新機能と改善点の概要。

新機能

このページでは、Potato v2.xリリース全体の新機能と改善点について説明します。


Potato 2.2.0

2026年2月20日リリース

Potato 2.2は、9つの新しいアノテーションスキーマ、プラグイン可能なエクスポートシステム、MACE能力推定、55の検証済みアンケート、リモートデータソースを含む主要な機能リリースです。

新しいアノテーションスキーマ(9種類)

イベントアノテーション — トリガースパンと型付き引数ロールを持つN項イベント構造。ATTACK、HIRE、TRAVELなどのイベントに制約付きエンティティ引数とハブスポーク型アーク可視化でアノテーションできます。

yaml
annotation_schemes:
  - annotation_type: event_annotation
    name: events
    span_schema: entities
    event_types:
      - type: "ATTACK"
        trigger_labels: ["EVENT_TRIGGER"]
        arguments:
          - role: "attacker"
            entity_types: ["PERSON", "ORGANIZATION"]
            required: true

イベントアノテーションの詳細 →

エンティティリンキング — スパンアノテーションを外部知識ベース(Wikidata、UMLS、カスタムREST API)にリンクします。任意のスパンスキーマにentity_linking:ブロックを追加して、KB検索とリンキングを有効にします。

エンティティリンキングの詳細 →

トリアージ — 高速データスクリーニングのためのProdigyスタイルの承認/却下/スキップインターフェース。カスタマイズ可能なラベル、キーボードショートカット、高スループットアノテーションのための自動進行機能があります。

トリアージの詳細 →

ペアワイズ比較 — バイナリ(好みのタイルをクリック)またはスケール(スライダー)モードで2つのアイテムを比較します。items_keyallow_tie、設定可能な範囲を持つscale:ブロックをサポートします。

ペアワイズ比較の詳細 →

会話ツリー — ノードごとの評価、パス選択、ブランチ比較による階層的な会話構造のアノテーション。

会話ツリーの詳細 →

共参照チェーン — 視覚的インジケーター付きで共参照するテキストメンションをチェーンにグループ化します。エンティティタイプ、シングルトン制御、複数のハイライトモードをサポートします。

共参照チェーンの詳細 →

セグメンテーションマスク — ピクセルレベルの画像セグメンテーション用の新しいfilleraserbrushツール。

PDF/ドキュメント用バウンディングボックス — ドキュメントアノテーションタスク用にPDFページ上にボックスを描画。

非連続スパンallow_discontinuous: trueで、非連続のテキストセグメントを単一のスパンとして選択可能に。


インテリジェントアノテーション

MACE能力推定 — 真のラベルとアノテーター能力スコア(0.0-1.0)を同時に推定する変分ベイズEMアルゴリズム。radio、likert、select、multiselectスキーマで動作します。

yaml
mace:
  enabled: true
  trigger_every_n: 10
  min_annotations_per_item: 3

MACEの詳細 →

オプションハイライト — 離散アノテーションタスクの正解候補をLLMベースでハイライト。スターインジケーターでトップkオプションをハイライトし、可能性の低いオプションを暗くします。

yaml
ai_support:
  option_highlighting:
    enabled: true
    top_k: 3
    dim_opacity: 0.4

オプションハイライトの詳細 →

多様性順序付け — 埋め込みベースのクラスタリングとラウンドロビンサンプリングにより、アノテーターが類似アイテムの連続ではなく多様なコンテンツを見ることを保証します。

yaml
assignment_strategy: diversity_clustering
diversity_ordering:
  enabled: true
  prefill_count: 100

多様性順序付けの詳細 →


エクスポートシステム

新しいプラグイン可能なエクスポートCLI(python -m potato.export)がアノテーションを6つの業界標準形式に変換します:COCO、YOLO、Pascal VOC、CoNLL-2003、CoNLL-U、セグメンテーションマスク。

bash
python -m potato.export --config config.yaml --format coco --output ./export/

エクスポート形式の詳細 →


リモートデータソース

URL、S3、Google Drive、Dropbox、Hugging Face、Google Sheets、SQLデータベースから新しいdata_sources:設定ブロック経由でアノテーションデータを読み込みます。部分読み込み、キャッシュ、認証情報管理を含みます。

リモートデータソースの詳細 →


アンケート

8カテゴリ(性格、メンタルヘルス、感情、自己概念、社会的態度、回答スタイル、短縮版、デモグラフィック)にわたる55の検証済みアンケート。instrument: "tipi"で事前/事後調査フェーズに使用できます。

アンケートの詳細 →


その他の改善

  • キーフレーム補間によるビデオオブジェクトトラッキング
  • 外部AI設定ファイルのサポート
  • フォームレイアウトのグリッド改善
  • PDF、Word、コード、スプレッドシートのフォーマットハンドラー

Potato 2.1.0

2026年2月5日リリース

Potato 2.1では、インスタンス表示システム、ビジュアルAIサポート、スパンリンキング、マルチフィールドスパンアノテーション、レイアウトカスタマイズが導入されました。

インスタンス表示システム

コンテンツ表示をアノテーションから分離する新しいinstance_display設定ブロック。画像、ビデオ、オーディオ、テキスト、対話の任意の組み合わせを任意のアノテーションスキームとともに表示できます。

yaml
instance_display:
  fields:
    - key: image_url
      type: image
      display_options:
        max_width: 600
        zoomable: true
    - key: description
      type: text
 
annotation_schemes:
  - annotation_type: radio
    name: category
    labels: [nature, urban, people]

texthtmlimagevideoaudiodialoguepairwisecodespreadsheetdocumentpdfを含む11の表示タイプをサポートします。

インスタンス表示の詳細 →


マルチフィールドスパンアノテーション

スパンアノテーションスキームがtarget_fieldオプションをサポートし、同じインスタンス内の複数のテキストフィールドにまたがってアノテーションできるようになりました。

yaml
annotation_schemes:
  - annotation_type: span
    name: source_entities
    target_field: "source_text"
    labels: [PERSON, ORGANIZATION]
 
  - annotation_type: span
    name: summary_entities
    target_field: "summary"
    labels: [PERSON, ORGANIZATION]

スパンアノテーションの詳細 →


スパンリンキング

アノテーション済みスパン間の型付き関係を作成するための新しいspan_linkアノテーションタイプ。有向・無向リンク、N項関係、視覚的アーク表示、ラベル制約をサポートします。

yaml
annotation_schemes:
  - annotation_type: span
    name: entities
    labels:
      - name: "PERSON"
        color: "#3b82f6"
      - name: "ORGANIZATION"
        color: "#22c55e"
 
  - annotation_type: span_link
    name: relations
    span_schema: entities
    link_types:
      - name: "WORKS_FOR"
        directed: true
        allowed_source_labels: ["PERSON"]
        allowed_target_labels: ["ORGANIZATION"]
        color: "#dc2626"

スパンリンキングの詳細 →


ビジュアルAIサポート

画像およびビデオアノテーション支援のための4つの新しいビジョンエンドポイント:

  • YOLO — 高速ローカルオブジェクト検出
  • Ollama Vision — ローカルビジョン言語モデル(LLaVA、Qwen-VL)
  • OpenAI Vision — GPT-4oクラウドビジョン
  • Anthropic Vision — Claudeのビジョン機能

オブジェクト検出、事前アノテーション、分類、ヒント、シーン検出、キーフレーム検出、オブジェクトトラッキングを含みます。

ビジュアルAIサポートの詳細 →


レイアウトカスタマイズ

HTMLテンプレートとCSSを使用した高度なカスタムビジュアルレイアウトの作成。Potatoは編集可能なレイアウトファイルを生成します。また、グリッドレイアウト、色分けされたオプション、セクションスタイリングを含む完全なカスタムテンプレートを提供することもできます。

yaml
task_layout: layouts/custom_task_layout.html

コンテンツモデレーション、対話QA、医療レビューの3つのレイアウト例が含まれています。

レイアウトカスタマイズの詳細 →


ラベル根拠

各ラベルが適用される理由についてバランスの取れた説明を生成する4番目のAI機能。アノテーターがさまざまな分類の観点を理解するのに役立ちます。

yaml
ai_support:
  features:
    rationales:
      enabled: true

AIサポートの詳細 →


その他の改善

  • 信頼性向上のための50以上の新しいテスト
  • レスポンシブデザインの改善
  • レイアウト例を含むプロジェクトハブの組織強化
  • アノテーションタイプ全体のバグ修正

v2.0とv2.1の比較

機能v2.0v2.1
インスタンス表示アノテーションのハックで対応専用のinstance_displayブロック
スパンターゲット単一テキストフィールドtarget_fieldでマルチフィールド
スパンリンキング利用不可完全なspan_linkタイプ
ビジュアルAI利用不可YOLO、Ollama Vision、OpenAI Vision、Anthropic Vision
レイアウトカスタマイズ基本的な自動生成自動生成+カスタムテンプレート
AI機能3つ(ヒント、キーワード、提案)4つ(+根拠)

Potato 2.0

Potato 2.0は、インテリジェントでスケーラブルなアノテーションのための強力な新機能を導入するメジャーリリースです。このセクションでは、主な追加機能と改善点を紹介します。

AIサポート

大規模言語モデルを統合して、インテリジェントなヒント、キーワードハイライト、ラベル提案でアノテーターを支援します。

サポートされるプロバイダー:

  • OpenAI (GPT-4, GPT-3.5)
  • Anthropic (Claude 3, Claude 3.5)
  • Google (Gemini)
  • Ollama(ローカルモデル)
  • vLLM(セルフホスト)
yaml
ai_support:
  enabled: true
  endpoint_type: openai
  ai_config:
    model: gpt-4
    api_key: ${OPENAI_API_KEY}
  features:
    hints:
      enabled: true
    label_suggestions:
      enabled: true

AIサポートの詳細 →


オーディオアノテーション

Peaks.jsを利用した波形可視化による本格的なオーディオアノテーション。セグメントの作成、時間領域のラベル付け、キーボードショートカットによる音声アノテーションが可能です。

主な機能:

  • 波形可視化
  • セグメントの作成とラベリング
  • セグメントごとのアノテーション質問
  • 15以上のキーボードショートカット
  • サーバーサイドの波形キャッシュ
yaml
annotation_schemes:
  - annotation_type: audio
    name: speakers
    mode: label
    labels:
      - Speaker A
      - Speaker B

オーディオアノテーションの詳細 →


アクティブラーニング

モデルの不確実性に基づいてアノテーションインスタンスを自動的に優先順位付けします。既存のアノテーションで分類器を訓練し、最も有益な例にアノテーターを集中させます。

機能:

  • 複数の分類器オプション(LogisticRegression、RandomForest、SVC、MultinomialNB)
  • さまざまなベクタライザー(TF-IDF、Count、Hashing)
  • 再起動時のモデル永続化
  • LLM強化選択
  • マルチスキーマサポート
yaml
active_learning:
  enabled: true
  schema_names:
    - sentiment
  min_instances_for_training: 30
  update_frequency: 50
  classifier:
    type: LogisticRegression

アクティブラーニングの詳細 →


トレーニングフェーズ

メインタスクの前に練習問題でアノテーターの資格を確認します。即時フィードバックを提供し、設定可能な合格基準で品質を確保します。

機能:

  • 既知の回答を持つ練習問題
  • 即時フィードバックと説明
  • 設定可能な合格基準
  • リトライオプション
  • 管理ダッシュボードでの進捗追跡
yaml
phases:
  training:
    enabled: true
    data_file: "data/training.json"
    passing_criteria:
      min_correct: 8
      total_questions: 10

トレーニングフェーズの詳細 →


強化された管理ダッシュボード

アノテーションタスクの包括的なモニタリングと管理インターフェース。

ダッシュボードタブ:

  • 概要: 高レベルメトリクスと完了率
  • アノテーター: パフォーマンス追跡、タイミング分析
  • インスタンス: 不一致スコア付きデータ閲覧
  • 設定: リアルタイム設定調整
yaml
admin_api_key: ${ADMIN_API_KEY}

管理ダッシュボードの詳細 →


データベースバックエンド

コネクションプーリングとトランザクションサポートを備えた大規模デプロイメント向けMySQLサポート。

yaml
database:
  type: mysql
  host: localhost
  database: potato_db
  user: ${DB_USER}
  password: ${DB_PASSWORD}

Potatoは初回起動時に必要なテーブルを自動的に作成します。


アノテーション履歴

タイムスタンプ、ユーザーID、アクションタイプを含むすべてのアノテーション変更の完全な追跡。監査と行動分析が可能になります。

json
{
  "history": [
    {
      "timestamp": "2024-01-15T10:30:00Z",
      "user": "annotator_1",
      "action": "create",
      "schema": "sentiment",
      "value": "Positive"
    }
  ]
}

マルチフェーズワークフロー

複数の順次フェーズを持つ複雑なアノテーションワークフローの構築:

  1. 同意 - インフォームドコンセントの収集
  2. 事前調査 - デモグラフィックとスクリーニング
  3. 指示 - タスクガイドライン
  4. トレーニング - 練習問題
  5. アノテーション - メインタスク
  6. 事後調査 - フィードバック調査
yaml
phases:
  consent:
    enabled: true
    data_file: "data/consent.json"
  prestudy:
    enabled: true
    data_file: "data/demographics.json"
  training:
    enabled: true
    data_file: "data/training.json"
  poststudy:
    enabled: true
    data_file: "data/feedback.json"

マルチフェーズワークフローの詳細 →


v2.0設定の変更

新しい設定構造

Potato 2.0ではよりクリーンな設定形式を使用します:

v1(旧):

yaml
data_files:
  - data.json
id_key: id
text_key: text
output_file: annotations.json

v2(新):

yaml
data_files:
  - "data/data.json"
 
item_properties:
  id_key: id
  text_key: text
 
output_annotation_dir: "output/"
output_annotation_format: "json"

セキュリティ要件

設定ファイルはtask_dir内に配置する必要があります:

yaml
# Valid - config.yaml is in the project directory
task_dir: "."
 
# Valid - config in configs/ subdirectory
task_dir: "my_project/"

クイック比較

機能v1v2.0v2.1v2.2
AI/LLMサポートなしありあり+ビジュアルAI+根拠+オプションハイライト
オーディオアノテーション基本完全な波形完全な波形完全な波形
アクティブラーニングなしありありあり+多様性順序付け
インスタンス表示なしなしありあり
スパンリンキングなしなしありあり
イベントアノテーションなしなしなしあり
エンティティリンキングなしなしなしあり
ペアワイズ/トリアージ/共参照/ツリーなしなしなしあり
レイアウトカスタマイズなし自動生成自動+カスタムテンプレート自動+カスタムテンプレート
トレーニングフェーズなしありありあり
管理ダッシュボード基本強化強化強化+MACE
データベースバックエンドファイルのみファイル+MySQLファイル+MySQLファイル+MySQL
エクスポートCLIなしなしなしあり(COCO、YOLO、CoNLLなど)
アンケートなしなしなし55の検証済みアンケート
リモートデータソースなしなしなしS3、GDrive、HuggingFaceなど

移行ガイド

設定の更新(v1からv2へ)

  1. データ設定

    yaml
    # Old
    id_key: id
    text_key: text
     
    # New
    item_properties:
      id_key: id
      text_key: text
  2. 出力設定

    yaml
    # Old
    output_file: annotations.json
     
    # New
    output_annotation_dir: "output/"
    output_annotation_format: "json"
  3. 設定ファイルの場所 設定ファイルがプロジェクトディレクトリ内にあることを確認してください。

サーバーの起動

bash
# v2 command
python -m potato start config.yaml -p 8000
 
# Or shorthand
potato start config.yaml

はじめに

Potatoを試す準備はできましたか?クイックスタートガイドから始めるか、特定の機能を探索してください:

v2.2の機能:

v2.1の機能:

コア機能: