Skip to content

よくある質問

Potatoに関するよくある質問への回答をご覧いただけます。お探しの内容が見つからない場合は、Discordに参加するか、ドキュメントをご確認ください。

はじめに

Potato(Portable Text Annotation Tool)は、高品質なデータセットを作成するための無料のオープンソースアノテーションツールです。シンプルなYAMLベースの設定システムにより、テキスト、画像、音声、動画のアノテーションをサポートしています。

はい、PotatoはPolyForm Shield License 1.0.0に基づく無料のオープンソースソフトウェアです。このライセンスは、研究、教育、および非商用目的での無料使用を許可しています。競合するアノテーションプラットフォームの構築にPotatoを使用することを制限する非競合条項が含まれています。詳細はGitHubリポジトリのLICENSEファイルをご確認ください。

プログラミングは不要です。Potatoは人間が読みやすく書きやすいYAML設定ファイルを使用しています。プレイグラウンドでは、コードを書かずにビジュアルインターフェースで設定を構築できます。

pipでインストールできます:`pip install potato-annotation`。次に`potato start my_project -c config.yaml`を実行してアノテーションサーバーを起動します。詳しい手順はクイックスタートガイドをご覧ください。

PotatoにはPython 3.7以上が必要です。最適な使用体験のためにPython 3.10以上をお勧めします。

Run pip install --upgrade potato-annotation.

Potato works in all modern browsers: Chrome, Firefox, Safari, and Edge.

データとプライバシー

データはお使いのマシンに保存されます。Potatoは完全にローカルで動作し、データを外部サーバーに送信することはありません。医療記録や機密コンテンツなどのセンシティブなデータに最適です。

はい。Potatoはセルフホスティングでローカルに動作するため、データを完全に管理できます。データがインフラの外に出ることはなく、HIPAA、GDPRなどのコンプライアンス要件に適しています。

Potatoは、プレーンテキスト、JSON、JSONL、CSV、TSV、画像(PNG、JPG、GIF、WebP)、音声(MP3、WAV、OGG)、動画ファイルなど、さまざまな入力形式をサポートしています。出力はJSON、JSONL、CSVのほか、CoNLL、spaCy、COCO、HuggingFace datasetsなどの専門形式にエクスポートできます。

アノテーション機能

Potatoは以下をサポートしています:ラジオボタン(単一選択)、チェックボックス(複数選択)、リッカート尺度、テキスト入力、スパンアノテーション(ハイライト)、バウンディングボックス、ポリゴン、ペアワイズ比較、Best-Worst Scalingなど。サンプルはショーケースをご覧ください。

はい。1つのアノテーションタスクにアノテーションスキームを任意に組み合わせることができます。たとえば、エンティティのハイライト(スパンアノテーション)、感情分類(ラジオボタン)、コメント入力(テキスト入力)を同じアイテムで行うことができます。

はい。Potatoは、ラジオ/チェックボックスラベルによる画像分類、物体検出のためのバウンディングボックスアノテーション、セグメンテーションタスクのためのポリゴンアノテーションをサポートしています。

はい。Potatoはアノテーションコントロールとともに音声波形や動画プレーヤーを表示できます。文字起こしレビュー、話者ダイアライゼーション、感情検出などのタスクに便利です。

設定ファイルにハイライトするテキストのスパンアノテーションスキームを追加します。アノテーターはテキストスパンを選択してラベルを割り当てることができます。NERとスパンアノテーションのサンプルはショーケースをご覧ください。

Yes. Potato supports custom CSS, HTML templates, and layout configuration via YAML.

アノテーター管理

Potatoは標準で複数のアノテーターをサポートしています。各アノテーターは一意のIDでログインし、アノテーションは個別に追跡されます。品質管理のために、複数のアノテーターが同じアイテムにラベル付けするオーバーラップを設定できます。

はい。PotatoはProlificおよびAmazon Mechanical Turkと統合しています。アノテーターはプラットフォームからリダイレクトされ、Potatoでタスクを完了し、完了コードとともに戻されます。

Potatoは複数のアノテーターによってアノテーションされたアイテムを追跡します。アノテーションをエクスポートし、標準的なPythonライブラリを使用して一致度指標(Cohen's Kappa、Krippendorff's Alphaなど)を計算できます。

はい。注意チェックアイテムの追加、必要なアノテーションオーバーラップの設定、管理ダッシュボードでのアノテーターの進捗監視と潜在的な問題の特定が可能です。

トラブルシューティング

よくある問題:1) config.yamlが有効なYAML構文であることを確認してください。2) データファイルが存在し、正しい形式であることを確認してください。3) ポート(デフォルトは8000)が他で使用されていないことを確認してください。4) ターミナル出力で具体的なエラーメッセージを確認してください。

以下を確認してください:1) 保存/送信ボタンをクリックしましたか。2) 出力ディレクトリに書き込み権限がありますか。3) 必須フィールドがすべて入力されていますか。ブラウザのコンソールでJavaScriptエラーを確認してください。

出力ディレクトリからそのアノテーターのアノテーションファイルを削除します。次回ログイン時に割り当てが再生成されます。

リアルタイムのサポートにはDiscordコミュニティに参加し、既知の問題についてはGitHub Issuesを確認するか、ドキュメントをご覧ください。コミュニティはフレンドリーで迅速に対応します!

まだ疑問がありますか?

コミュニティがサポートいたします。リアルタイムのサポートはDiscordに参加するか、ドキュメントで詳細なガイドをご覧ください。