Question 1

什么是 Potato？

Accepted Answer

Potato（Portable Text Annotation Tool，便携式文本标注工具）是一款免费、开源的标注工具，用于创建高质量数据集。它支持文本、图像、音频和视频标注，采用简单的基于 YAML 的配置系统。

Question 2

Potato 真的免费吗？

Accepted Answer

是的。Potato 在 GNU 通用公共许可证 v3.0 或更高版本（GPL-3.0-or-later）下免费且开源。您可以使用、修改和再分发它，包括商业用途，只要衍生作品仍以 GPL 授权。早期版本使用 PolyForm Shield 许可证；Potato 在 2.6 版本中重新以 GPL-3.0 授权。完整文本请查看 GitHub 仓库中的 LICENSE 文件。

Question 3

使用 Potato 需要编程知识吗？

Accepted Answer

不需要。Potato 使用人类可读且易于编写的 YAML 配置文件。我们的在线构建器（Playground）提供可视化界面，无需编写任何代码即可生成配置。

Question 4

如何安装 Potato？

Accepted Answer

通过 pip 安装：`pip install potato-annotation`。然后运行 `potato start my_project -c config.yaml` 启动标注服务器。详细说明请参阅我们的快速入门指南。

Question 5

Potato 需要什么版本的 Python？

Accepted Answer

Potato 需要 Python 3.7 或更高版本。我们建议使用 Python 3.10+ 以获得最佳体验。

Question 6

How do I upgrade Potato?

Accepted Answer

Run pip install --upgrade potato-annotation.

Question 7

What browsers does Potato support?

Accepted Answer

Potato works in all modern browsers: Chrome, Firefox, Safari, and Edge.

Question 8

我的数据存储在哪里？

Accepted Answer

您的数据保留在您的本地机器上。Potato 完全在本地运行，不会将您的数据发送到外部服务器。这使其非常适合处理医疗记录或专有内容等敏感数据。

Question 9

Potato 可以处理敏感或隐私数据吗？

Accepted Answer

可以。由于 Potato 是自托管的且在本地运行，您可以完全控制您的数据。数据绝不会离开您的基础设施，适用于 HIPAA、GDPR 等合规要求。

Question 10

Potato 支持哪些数据格式？

Accepted Answer

Potato 支持多种输入格式，包括纯文本、JSON、JSONL、CSV、TSV、图像（PNG、JPG、GIF、WebP）、音频（MP3、WAV、OGG）和视频文件。输出可以导出为 JSON、JSONL、CSV 以及 CoNLL、spaCy、COCO 和 HuggingFace datasets 等专用格式。

Question 11

Potato 支持哪些标注类型？

Accepted Answer

Potato 支持：单选按钮（单项选择）、复选框（多项选择）、李克特量表、文本输入、文本片段标注（高亮标注）、边界框、多边形、成对比较、最佳-最差缩放等。详见我们的展示页面。

Question 12

可以组合多种标注类型吗？

Accepted Answer

可以。单个标注任务可以包含任意组合的标注方案。例如，您可以让标注员在同一条目上高亮实体（文本片段标注）、分类情感（单选按钮）并提供评论（文本输入）。

Question 13

Potato 支持图像标注吗？

Accepted Answer

支持。Potato 支持使用单选/复选标签的图像分类、用于目标检测的边界框标注，以及用于分割任务的多边形标注。

Question 14

Potato 可以标注音频和视频吗？

Accepted Answer

可以。Potato 可以在标注控件旁边显示音频波形和视频播放器。这对于语音转写审核、说话人分离、情感检测等任务非常有用。

Question 15

如何设置文本片段标注？

Accepted Answer

在配置中添加文本片段标注方案并指定需要高亮的文本。标注员可以选择文本片段并分配标签。请参阅我们展示页面中的 NER 和文本片段标注示例。

Question 16

Can I customize the annotation interface appearance?

Accepted Answer

Yes. Potato supports custom CSS, HTML templates, and layout configuration via YAML.

Question 17

如何管理多个标注员？

Accepted Answer

Potato 开箱即支持多标注员。每个标注员使用唯一 ID 登录，其标注记录独立跟踪。您可以配置重叠标注，让多个标注员对同一条目进行标注以进行质量控制。

Question 18

可以与众包平台集成吗？

Accepted Answer

可以。Potato 支持与 Prolific 和 Amazon Mechanical Turk 集成。标注员从平台重定向过来，在 Potato 中完成任务后，带着完成码返回平台。

Question 19

如何计算标注员间一致性？

Accepted Answer

Potato 会跟踪哪些条目已被多个标注员标注。您可以导出标注数据，使用标准 Python 库计算一致性指标（Cohen's Kappa、Krippendorff's Alpha 等）。

Question 20

可以设置质量控制检查吗？

Accepted Answer

可以。您可以添加注意力检查题目、配置所需的标注重叠数量，并使用管理面板监控标注员进度和发现潜在问题。

Question 21

Potato 无法启动，应该检查什么？

Accepted Answer

常见问题：1）检查 config.yaml 的 YAML 语法是否正确。2）确保数据文件存在且格式正确。3）检查端口（默认 8000）是否已被占用。4）查看终端输出中的具体错误信息。

Question 22

标注没有保存，怎么回事？

Accepted Answer

请检查：1）您是否点击了保存/提交按钮。2）输出目录是否可写。3）所有必填字段是否已填写。请在浏览器控制台中查看 JavaScript 错误。

Question 23

如何重置标注员的进度？

Accepted Answer

从输出目录中删除该标注员的标注文件。其任务分配将在下次登录时重新生成。

Question 24

在哪里可以获得帮助？

Accepted Answer

加入我们的 Discord 社区获取实时帮助，在 GitHub Issues 中查看已知问题，或浏览我们的文档。社区氛围友好且响应迅速！

常见问题

快速入门

数据与隐私

标注功能

标注员管理

故障排查

还有其他问题？