Apresentando o Potato 2.0: Anotação com Inteligência Artificial
O Potato 2.0 traz pré-anotação com IA usando OpenAI e Claude, suporte a multimídia para áudio e vídeo, aprendizado ativo, anotação por caixas delimitadoras e uma interface redesenhada.
Nota: Este post descreve o Potato 2.0 como ele era no lançamento. Algumas chaves de configuração e recursos foram atualizados em versões posteriores. Consulte a documentação atual para a sintaxe de configuração mais recente.
O Potato 2.0 chegou, e é a maior atualização que já lançamos. Os destaques são os recursos com inteligência artificial, o suporte mais amplo a multimídia e um módulo de aprendizado ativo. Juntos, eles mudam a forma como você constrói dados de treinamento.
O que há de novo no Potato 2.0
Assistência de anotação com inteligência artificial
O Potato 2.0 se conecta ao OpenAI GPT-4, ao Anthropic Claude e ao Google Gemini. Depois de configurar um deles, o modelo pode sugerir anotações que o anotador fica livre para aceitar, editar ou descartar. Ele pode destacar termos e frases importantes para que a atenção recaia onde deve. E pode sinalizar possíveis problemas com uma anotação enquanto o anotador trabalha, sem tirar dele a decisão.
# Enable AI assistance in your config
ai_support:
enabled: true
endpoint_type: openai
ai_config:
model: gpt-4
api_key: ${OPENAI_API_KEY}
features:
hints:
enabled: true
keyword_highlighting:
enabled: true
label_suggestions:
enabled: trueSuporte a multimídia
O Potato começou como uma ferramenta de texto, e isso continua sendo o núcleo. Agora ele também trabalha com imagens (classificação, caixas delimitadoras, polígonos e detecção de pontos-chave), áudio (exibição de forma de onda, revisão de transcrição, diarização de falantes) e vídeo (navegação quadro a quadro, marcação temporal de eventos, rastreamento de objetos).
Aprendizado ativo
O novo módulo de aprendizado ativo pode reduzir o esforço de anotação em até 50%. Ele se integra a qualquer classificador do sklearn para trazer à tona os itens sobre os quais o modelo tem menos certeza, retreina à medida que novas anotações chegam para que a amostragem continue melhorando, e permite que você defina o classificador e a extração de características em YAML.
Migração do Potato 1.x
Atualizar a partir do Potato 1.x é tranquilo. Seus arquivos de configuração YAML existentes continuam funcionando, e há uma ferramenta de migração que ajuda você a adotar os novos recursos:
# Upgrade your installation
pip install --upgrade potato-annotation
# Run the migration helper
potato migrate config.yaml --to-v2Melhorias de desempenho
A renderização das páginas está mais rápida, grandes conjuntos de dados carregam de forma mais suave e o gerenciamento de sessões se mantém melhor quando vários anotadores trabalham ao mesmo tempo.
Para o relato completo do que mudou, consulte as notas de lançamento da 2.0.
Primeiros passos
A instalação é em uma linha:
pip install potato-annotation
potato start your_config.yamlO Guia de Início Rápido traz um passo a passo completo, e a Vitrine tem configurações de exemplo para copiar.
O que vem a seguir
O Potato não parou desde a 2.0:
Potato 2.1 adicionou exibição de instâncias, suporte a IA visual (YOLO, Ollama Vision, OpenAI Vision), vinculação de spans e personalização de layout.
Potato 2.2 (já disponível) adiciona 9 novos esquemas de anotação (anotação de eventos, vinculação de entidades, triagem, comparação pareada, cadeias de correferência, árvores de conversa e mais), uma CLI de exportação plugável, estimativa de competência de anotadores com MACE, 55 instrumentos de pesquisa validados e fontes de dados remotas.
Obrigado aos pesquisadores e profissionais que moldaram o Potato ao longo do caminho. O feedback de vocês é o que orienta o roadmap.
Tem perguntas ou comentários? Participe das nossas Discussões no GitHub ou fale conosco no Twitter @PotatoAnnotation.