Potato 2.0 출시: AI 기반 어노테이션
Potato 2.0은 OpenAI 및 Claude를 활용한 AI 기반 사전 어노테이션, 오디오 및 비디오 멀티미디어 지원, 능동 학습, 바운딩 박스 어노테이션, 그리고 새롭게 디자인된 UI를 제공합니다.
참고: 이 글은 출시 당시의 Potato 2.0을 설명합니다. 일부 구성 키와 기능은 이후 버전에서 업데이트되었습니다. 최신 구성 문법은 현재 문서를 참고하시기 바랍니다.
Potato 2.0이 출시되었으며, 지금까지 배포한 것 중 가장 큰 업데이트입니다. 핵심 추가 사항은 AI 기반 기능, 더 넓어진 멀티미디어 지원, 그리고 능동 학습 모듈입니다. 이들이 함께 어우러져 학습 데이터를 구축하는 방식을 바꿉니다.
Potato 2.0의 새로운 점
AI 기반 어노테이션 지원
Potato 2.0은 OpenAI GPT-4, Anthropic Claude, Google Gemini에 연결됩니다. 한 번 연동해 두면 모델이 어노테이션을 제안하고, 어노테이터는 이를 자유롭게 수락하거나 수정하거나 버릴 수 있습니다. 또한 중요한 용어와 구절을 강조하여 주의가 마땅히 향해야 할 곳에 머물도록 합니다. 그리고 어노테이터가 작업하는 동안 어노테이션의 잠재적 문제를 표시하되, 결정권은 어노테이터에게서 빼앗지 않습니다.
# Enable AI assistance in your config
ai_support:
enabled: true
endpoint_type: openai
ai_config:
model: gpt-4
api_key: ${OPENAI_API_KEY}
features:
hints:
enabled: true
keyword_highlighting:
enabled: true
label_suggestions:
enabled: true멀티미디어 지원
Potato는 텍스트 도구로 시작했고, 그것은 여전히 핵심입니다. 이제는 이미지(분류, 바운딩 박스, 다각형, 키포인트 검출), 오디오(파형 표시, 전사 검토, 화자 분리), 비디오(프레임 단위 탐색, 시간 기반 이벤트 표시, 객체 추적)도 다룹니다.
능동 학습
새로운 능동 학습 모듈은 어노테이션 작업량을 최대 50%까지 줄일 수 있습니다. 어떤 sklearn 분류기와도 연동되어 모델이 가장 확신하지 못하는 항목을 드러내고, 새 어노테이션이 들어오는 대로 재학습하여 샘플링이 계속 개선되도록 하며, 분류기와 특징 추출을 YAML에서 설정할 수 있게 합니다.
Potato 1.x에서의 마이그레이션
Potato 1.x에서 업그레이드하는 일은 수월합니다. 기존 YAML 구성은 그대로 작동하며, 새 기능을 받아들이도록 도와주는 마이그레이션 도구가 있습니다.
# Upgrade your installation
pip install --upgrade potato-annotation
# Run the migration helper
potato migrate config.yaml --to-v2성능 개선
페이지 렌더링이 더 빨라졌고, 대규모 데이터셋이 더 매끄럽게 로드되며, 여러 어노테이터가 동시에 작업할 때 세션 관리가 더 안정적으로 버팁니다.
변경 사항의 전체 내역은 2.0 릴리스 노트를 참고하시기 바랍니다.
시작하기
설치는 한 줄이면 됩니다.
pip install potato-annotation
potato start your_config.yaml빠른 시작 가이드에 전체 안내가 있으며, 쇼케이스에는 따라 쓸 수 있는 예시 구성이 있습니다.
다음은 무엇인가
Potato는 2.0 이후로도 계속 발전해 왔습니다.
Potato 2.1은 인스턴스 표시, 시각 AI 지원(YOLO, Ollama Vision, OpenAI Vision), 스팬 연결, 레이아웃 사용자 정의를 추가했습니다.
Potato 2.2(현재 이용 가능)는 9개의 새로운 어노테이션 스키마(이벤트 어노테이션, 엔티티 연결, 분류, 쌍대 비교, 상호참조 체인, 대화 트리 등), 플러그형 내보내기 CLI, MACE 어노테이터 역량 추정, 55개의 검증된 설문 도구, 원격 데이터 소스를 추가합니다.
그동안 Potato를 다듬어 온 연구자와 실무자 여러분께 감사드립니다. 여러분의 피드백이 로드맵을 이끄는 힘입니다.
질문이나 의견이 있으신가요? 저희 GitHub 토론에 참여하시거나 Twitter @PotatoAnnotation으로 연락 주시기 바랍니다.