Skip to content

자주 묻는 질문

Potato에 관한 일반적인 질문의 답변을 찾아보세요. 원하는 내용을 찾지 못하셨나요? Discord에 참여하거나 문서를 확인해 보세요.

시작하기

Potato(Portable Text Annotation Tool)는 고품질 데이터셋을 만들기 위한 무료 오픈 소스 주석 도구입니다. 간단한 YAML 기반 설정 시스템으로 텍스트, 이미지, 오디오, 비디오 주석을 지원합니다.

네, Potato는 PolyForm Shield License 1.0.0에 따라 무료로 제공되는 오픈 소스입니다. 이 라이선스는 연구, 교육, 비상업적 목적의 무료 사용을 허용합니다. 다만 Potato를 이용해 경쟁 주석 플랫폼을 만드는 것을 제한하는 비경쟁 조항이 포함되어 있습니다. 자세한 내용은 GitHub 저장소의 LICENSE 파일을 참고하세요.

코딩은 필요 없습니다. Potato는 사람이 읽기 쉽고 작성하기 쉬운 YAML 설정 파일을 사용합니다. 플레이그라운드는 코드를 한 줄도 작성하지 않고 설정을 만들 수 있는 시각적 인터페이스를 제공합니다.

pip로 설치합니다: `pip install potato-annotation`. 그런 다음 `potato start my_project -c config.yaml`을 실행해 주석 서버를 시작합니다. 자세한 방법은 빠른 시작 가이드를 참고하세요.

Potato는 Python 3.7 이상이 필요합니다. 최상의 사용 환경을 위해 Python 3.10 이상을 권장합니다.

`pip install --upgrade potato-annotation`을 실행하세요. 새 기능은 /blog의 변경 로그를 확인하세요. 기존 설정은 상위 호환되므로 마이너 버전 업데이트에는 마이그레이션이 필요 없습니다.

Potato는 Chrome, Firefox, Safari, Edge 등 모든 최신 브라우저에서 작동합니다. 최상의 사용 환경을 위해 Chrome이나 Firefox를 권장합니다. 주석 인터페이스는 반응형이라 태블릿에서도 작동하지만, 복잡한 작업에는 데스크톱을 권장합니다.

데이터 및 프라이버시

데이터는 사용자의 컴퓨터에 그대로 남습니다. Potato는 전적으로 로컬에서 실행되며 데이터를 외부 서버로 전송하지 않습니다. 의료 기록이나 독점 콘텐츠처럼 민감한 데이터에 이상적입니다.

네. Potato는 셀프 호스팅 방식으로 로컬에서 실행되므로 데이터를 완전히 통제할 수 있습니다. 어떤 데이터도 사용자의 인프라를 벗어나지 않으므로 HIPAA, GDPR 등 규정 요건에 적합합니다.

Potato는 일반 텍스트, JSON, JSONL, CSV, TSV, 이미지(PNG, JPG, GIF, WebP), 오디오(MP3, WAV, OGG), 비디오 파일 등 다양한 입력 형식을 지원합니다. 출력은 JSON, JSONL, CSV는 물론 CoNLL, spaCy, COCO, HuggingFace 데이터셋 같은 특수 형식으로 내보낼 수 있습니다.

주석 기능

Potato는 라디오 버튼(단일 선택), 체크박스(다중 선택), 리커트 척도, 텍스트 입력, 스팬 주석(강조), 바운딩 박스, 폴리곤, 쌍대 비교, 최선-최악 척도 등을 지원합니다. 예시는 쇼케이스를 확인하세요.

네. 하나의 주석 작업에 주석 스키마를 원하는 대로 조합할 수 있습니다. 예를 들어 같은 항목에서 주석자가 개체를 강조(스팬 주석)하고, 감성을 분류(라디오 버튼)하고, 의견을 작성(텍스트 입력)하도록 할 수 있습니다.

네. Potato는 라디오/체크박스 레이블을 이용한 이미지 분류, 객체 탐지를 위한 바운딩 박스 주석, 세그멘테이션 작업을 위한 폴리곤 주석을 지원합니다.

네. Potato는 주석 컨트롤과 함께 오디오 파형과 비디오 플레이어를 표시할 수 있습니다. 전사 검토, 화자 분리, 감정 탐지 등 유사한 작업에 유용합니다.

강조할 텍스트와 함께 설정에 스팬 주석 스키마를 추가합니다. 주석자는 텍스트 스팬을 선택하고 레이블을 지정할 수 있습니다. 쇼케이스의 개체명 인식 및 스팬 주석 예시를 참고하세요.

네. Potato는 사용자 지정 CSS, 사용자 지정 HTML 템플릿, YAML을 통한 레이아웃 설정을 지원합니다. 사용자 지정 헤더, 푸터, 안내문, 스타일을 추가할 수 있습니다. 자세한 내용은 레이아웃 맞춤 설정 문서를 참고하세요.

주석자 관리

Potato는 기본적으로 여러 주석자를 지원합니다. 각 주석자는 고유 ID로 로그인하며 주석은 별도로 추적됩니다. 품질 관리를 위해 여러 주석자가 같은 항목에 레이블을 달도록 중복을 설정할 수 있습니다.

네. Potato는 Prolific 및 Amazon Mechanical Turk와 연동됩니다. 주석자는 해당 플랫폼에서 리디렉션되어 Potato에서 작업을 완료한 뒤 완료 코드와 함께 돌아갑니다.

Potato는 여러 주석자가 주석한 항목을 추적합니다. 주석을 내보낸 뒤 표준 Python 라이브러리로 일치도 지표(코헨의 카파, 크리펜도르프의 알파 등)를 계산할 수 있습니다.

네. 주의력 확인 항목을 추가하고, 필요한 주석 중복을 설정하며, 관리자 대시보드로 주석자 진행 상황을 모니터링하고 잠재적 문제를 파악할 수 있습니다.

문제 해결

흔한 문제는 다음과 같습니다. 1) config.yaml이 유효한 YAML 구문인지 확인하세요. 2) 데이터 파일이 존재하고 올바른 형식인지 확인하세요. 3) 포트(기본값 8000)가 이미 사용 중이 아닌지 확인하세요. 4) 구체적인 오류 메시지가 있는지 터미널 출력을 살펴보세요.

다음을 확인하세요. 1) 저장/제출 버튼을 눌렀는지. 2) 출력 디렉터리에 쓰기 권한이 있는지. 3) 필수 필드를 모두 채웠는지. JavaScript 오류가 있는지 브라우저 콘솔도 확인하세요.

출력 디렉터리에서 해당 주석자의 주석 파일을 삭제하세요. 다음 로그인 시 배정이 다시 생성됩니다.

실시간 도움이 필요하면 Discord 커뮤니티에 참여하고, 알려진 문제는 GitHub Issues를 확인하거나 문서를 살펴보세요. 커뮤니티는 친절하고 응답이 빠릅니다!

아직 궁금한 점이 있으신가요?

커뮤니티가 도와드립니다. 실시간 지원이 필요하면 Discord에 참여하거나, 자세한 안내가 필요하면 문서를 살펴보세요.