Skip to content

よくある質問

Potatoに関するよくある質問への回答をご覧いただけます。お探しの内容が見つからない場合は、Discordに参加するか、ドキュメントをご確認ください。

はじめに

Potato(Portable Text Annotation Tool)は、高品質なデータセットを作成するための無料のオープンソースアノテーションツールです。シンプルなYAMLベースの設定システムにより、テキスト、画像、音声、動画のアノテーションをサポートしています。

はい、PotatoはPolyForm Shield License 1.0.0に基づく無料のオープンソースソフトウェアです。このライセンスは、研究、教育、および非商用目的での無料使用を許可しています。競合するアノテーションプラットフォームの構築にPotatoを使用することを制限する非競合条項が含まれています。詳細はGitHubリポジトリのLICENSEファイルをご確認ください。

プログラミングは不要です。Potatoは人間が読みやすく書きやすいYAML設定ファイルを使用しています。プレイグラウンドでは、コードを書かずにビジュアルインターフェースで設定を構築できます。

pipでインストールできます:`pip install potato-annotation`。次に`potato start my_project -c config.yaml`を実行してアノテーションサーバーを起動します。詳しい手順はクイックスタートガイドをご覧ください。

PotatoにはPython 3.7以上が必要です。最適な使用体験のためにPython 3.10以上をお勧めします。

Run pip install --upgrade potato-annotation.

Potato works in all modern browsers: Chrome, Firefox, Safari, and Edge.

データとプライバシー

データはお使いのマシンに保存されます。Potatoは完全にローカルで動作し、データを外部サーバーに送信することはありません。医療記録や機密コンテンツなどのセンシティブなデータに最適です。

はい。Potatoはセルフホスティングでローカルに動作するため、データを完全に管理できます。データがインフラの外に出ることはなく、HIPAA、GDPRなどのコンプライアンス要件に適しています。

Potatoは、プレーンテキスト、JSON、JSONL、CSV、TSV、画像(PNG、JPG、GIF、WebP)、音声(MP3、WAV、OGG)、動画ファイルなど、さまざまな入力形式をサポートしています。出力はJSON、JSONL、CSVのほか、CoNLL、spaCy、COCO、HuggingFace datasetsなどの専門形式にエクスポートできます。

アノテーション機能

Potatoは以下をサポートしています:ラジオボタン(単一選択)、チェックボックス(複数選択)、リッカート尺度、テキスト入力、スパンアノテーション(ハイライト)、バウンディングボックス、ポリゴン、ペアワイズ比較、Best-Worst Scalingなど。サンプルはショーケースをご覧ください。

はい。1つのアノテーションタスクにアノテーションスキームを任意に組み合わせることができます。たとえば、エンティティのハイライト(スパンアノテーション)、感情分類(ラジオボタン)、コメント入力(テキスト入力)を同じアイテムで行うことができます。

はい。Potatoは、ラジオ/チェックボックスラベルによる画像分類、物体検出のためのバウンディングボックスアノテーション、セグメンテーションタスクのためのポリゴンアノテーションをサポートしています。

はい。Potatoはアノテーションコントロールとともに音声波形や動画プレーヤーを表示できます。文字起こしレビュー、話者ダイアライゼーション、感情検出などのタスクに便利です。

設定ファイルにハイライトするテキストのスパンアノテーションスキームを追加します。アノテーターはテキストスパンを選択してラベルを割り当てることができます。NERとスパンアノテーションのサンプルはショーケースをご覧ください。

Yes. Potato supports custom CSS, HTML templates, and layout configuration via YAML.

アノテーター管理

Potatoは標準で複数のアノテーターをサポートしています。各アノテーターは一意のIDでログインし、アノテーションは個別に追跡されます。品質管理のために、複数のアノテーターが同じアイテムにラベル付けするオーバーラップを設定できます。

はい。PotatoはProlificおよびAmazon Mechanical Turkと統合しています。アノテーターはプラットフォームからリダイレクトされ、Potatoでタスクを完了し、完了コードとともに戻されます。

Potatoは複数のアノテーターによってアノテーションされたアイテムを追跡します。アノテーションをエクスポートし、標準的なPythonライブラリを使用して一致度指標(Cohen's Kappa、Krippendorff's Alphaなど)を計算できます。

はい。注意チェックアイテムの追加、必要なアノテーションオーバーラップの設定、管理ダッシュボードでのアノテーターの進捗監視と潜在的な問題の特定が可能です。

LLM統合

はい。PotatoはOpenAI、Anthropic Claude、Google Gemini、およびOllamaを介したローカルLLMと統合しています。AIによる事前アノテーションを設定して、人間のアノテーションワークフローを加速できます。

設定ファイルに`llm`セクションを追加し、プロバイダー、モデル、プロンプトテンプレートを指定します。Potatoは各アイテムに対してLLM APIを呼び出し、アノテーターが承認または修正できるアノテーションフィールドを事前入力します。

はい。PotatoはOllamaによるローカルLLMの実行をサポートしています。AI支援の恩恵を受けながら、データを完全にプライベートに保つことができます。

はい。PotatoはRLHFのための人間の嗜好データ収集に適しています。ペアワイズ比較を使用してモデル出力の中から選択したり、リッカート尺度を使用して応答品質を評価したりできます。

Agent Evaluation

Yes. Potato converts LangChain/LangSmith traces automatically.

No. The live agent supports Ollama for fully local inference with no API key.

Yes. Potato supports CrewAI, AutoGen, and LangGraph trace formats.

Use the generic ReAct converter or the webhook API to send traces in any JSON format.

Yes. Live agent mode lets annotators pause the agent, send instructions, or take over manual control.

Use the agent_eval exporter: python -m potato.export -f agent_eval -o results/.

デプロイ

はい。Potatoはデフォルトでローカルに動作しますが、任意のサーバーにデプロイできます。HTTPSのためにnginxやApacheの背後で実行するか、Dockerでコンテナ化してデプロイできます。

カスタムDockerfileを使用してPotatoをコンテナ化できます。現在公式Dockerイメージは提供していませんが、標準的なPythonベースイメージを使用して独自に作成できます。デプロイに関するドキュメントをご覧ください。

Yes. Create a Dockerfile with a Python base image and install potato-annotation.

はい。サーバーにデプロイした場合、複数のアノテーターが同じPotatoインスタンスに同時にアクセスできます。各アノテーターの作業は個別に追跡されます。

nginxやCaddyなどのリバースプロキシの背後にPotatoをデプロイし、SSL終端を処理します。設定例についてはデプロイガイドをご覧ください。

Annotations are saved as JSON/JSONL files in your configured output directory. Back up that directory regularly.

トラブルシューティング

よくある問題:1) config.yamlが有効なYAML構文であることを確認してください。2) データファイルが存在し、正しい形式であることを確認してください。3) ポート(デフォルトは8000)が他で使用されていないことを確認してください。4) ターミナル出力で具体的なエラーメッセージを確認してください。

以下を確認してください:1) 保存/送信ボタンをクリックしましたか。2) 出力ディレクトリに書き込み権限がありますか。3) 必須フィールドがすべて入力されていますか。ブラウザのコンソールでJavaScriptエラーを確認してください。

出力ディレクトリからそのアノテーターのアノテーションファイルを削除します。次回ログイン時に割り当てが再生成されます。

リアルタイムのサポートにはDiscordコミュニティに参加し、既知の問題についてはGitHub Issuesを確認するか、ドキュメントをご覧ください。コミュニティはフレンドリーで迅速に対応します!

まだ疑問がありますか?

コミュニティがサポートいたします。リアルタイムのサポートはDiscordに参加するか、ドキュメントで詳細なガイドをご覧ください。