자동 키워드 강조
Potato에서 AI 기반 키워드 강조를 구성하여 중요한 용어로 어노테이터의 주의를 이끌어 보세요. OpenAI, Claude, 사용자 정의 키워드 목록 구성을 다룹니다.
AI 기반 키워드 강조는 텍스트에서 중요한 용어, 엔티티, 패턴으로 어노테이터의 시선을 이끕니다. 이 가이드는 Potato에 내장된 AI 지원과, 관련 키워드가 스스로 강조되도록 설정하는 방법을 차례로 살펴봅니다.
키워드 강조를 사용하는 이유
이는 어노테이터를 실제로 중요한 텍스트 부분으로 안내하여, 핵심 정보를 더 빨리 찾고 중요한 용어를 대충 훑고 지나칠 가능성을 줄여 줍니다. 강조가 LLM에서 나오기 때문에 고정된 단어 목록에 의존하는 대신 각 항목의 맥락에 맞춰 적응할 수 있습니다.
Potato의 옵션 강조와 키워드 강조가 내부적으로 어떻게 작동하는지는 원본 문서를 참고하시기 바랍니다.
기본 AI 기반 강조
Potato는 중요한 키워드를 찾아 강조하기 위해 AI 지원 시스템에 의존합니다. 다음은 최소 구성입니다.
annotation_task_name: "Keyword Highlighted Annotation"
data_files:
- path: "data/reviews.json"
format: json
item_properties:
id_key: id
text_key: text
annotation_schemes:
- annotation_type: radio
name: sentiment
description: "What is the overall sentiment?"
labels:
- Positive
- Negative
- Neutral
ai_support:
enabled: true
endpoint_type: openai
ai_config:
model: gpt-4
api_key: ${OPENAI_API_KEY}
temperature: 0.3
max_tokens: 500
features:
keyword_highlighting:
enabled: true
# Highlights are rendered as box overlays on the textAI 키워드 강조가 활성화되면 관련 용어가 어노테이션 텍스트에서 자동으로 강조됩니다.
중요한 키워드와 엔티티가 자동으로 강조되어 어노테이터의 주의를 안내합니다
다양한 AI 제공자 사용하기
OpenAI
ai_support:
enabled: true
endpoint_type: openai
ai_config:
model: gpt-4o
api_key: ${OPENAI_API_KEY}
temperature: 0.3
max_tokens: 500
features:
keyword_highlighting:
enabled: true
Anthropic Claude
ai_support:
enabled: true
endpoint_type: anthropic
ai_config:
model: claude-3-sonnet-20240229
api_key: ${ANTHROPIC_API_KEY}
temperature: 0.3
max_tokens: 500
features:
keyword_highlighting:
enabled: true
# Highlights are rendered as box overlays on the text로컬 Ollama (API 비용 없음)
ai_support:
enabled: true
endpoint_type: ollama
ai_config:
model: llama2
base_url: http://localhost:11434
features:
keyword_highlighting:
enabled: true
# Highlights are rendered as box overlays on the text기능 결합하기
AI 기능들은 서로 쌓이며, 따로보다 함께 쓸 때 더 유용한 경우가 많습니다.
ai_support:
enabled: true
endpoint_type: openai
ai_config:
model: gpt-4
api_key: ${OPENAI_API_KEY}
temperature: 0.3
max_tokens: 500
features:
# Highlight important keywords
keyword_highlighting:
enabled: true
# Highlights are rendered as box overlays on the text
# Show contextual hints
hints:
enabled: true
# Suggest labels for consideration
label_suggestions:
enabled: true
show_confidence: true전체 구성 예시
다음은 AI 강조를 적용한 엔티티 인식 어노테이션의 전체 구성입니다.
annotation_task_name: "Entity-Aware Annotation"
data_files:
- path: "data/documents.json"
format: json
item_properties:
id_key: id
text_key: text
annotation_schemes:
- annotation_type: span
name: entities
labels:
- name: PERSON
color: "#FECACA"
- name: ORG
color: "#BBF7D0"
- name: LOCATION
color: "#BFDBFE"
ai_support:
enabled: true
endpoint_type: openai
ai_config:
model: gpt-4
api_key: ${OPENAI_API_KEY}
temperature: 0.3
max_tokens: 500
features:
keyword_highlighting:
enabled: true
# Highlights are rendered as box overlays on the text
hints:
enabled: true
label_suggestions:
enabled: true
show_confidence: true
cache_config:
disk_cache:
enabled: true
path: "ai_cache/cache.json"
prefetch:
warm_up_page_count: 50
on_next: 3
on_prev: 2
output_annotation_dir: "output/"
export_annotation_format: json
allow_all_users: true성능을 위한 캐싱
캐싱을 켜서 API 호출을 줄이고 응답 속도를 높이시기 바랍니다.
ai_support:
enabled: true
endpoint_type: openai
ai_config:
model: gpt-4
api_key: ${OPENAI_API_KEY}
features:
keyword_highlighting:
enabled: true
cache_config:
disk_cache:
enabled: true
path: "ai_cache/cache.json"
# Pre-generate highlights on startup and prefetch upcoming
prefetch:
warm_up_page_count: 100
on_next: 5
on_prev: 2팁
강조 색상은 어노테이션 스키마와 충돌하기보다는 잘 어울리는 것으로 고르시기 바랍니다. 같은 콘텐츠에 두 번 비용을 치르지 않도록 캐싱은 켜 두십시오. 대량으로 어노테이션한다면 Ollama는 로컬에서 실행되어 API 청구를 완전히 건너뜁니다. 그리고 기능들은 서로 쌓인다는 점을 기억하십시오. 키워드 강조는 힌트 및 레이블 제안과 자연스럽게 어울립니다.
전체 문서는 /docs/features/ai-support에 있습니다.