Skip to content

신뢰도 어노테이션

Likert 척도나 슬라이더를 사용하여 Potato에서 다른 어노테이션과 함께 신뢰도 평가를 추가해 어노테이터의 확신 정도를 포착합니다.

신뢰도 어노테이션 스키마는 어노테이터가 자신이 만든 다른 어노테이션에 대한 신뢰도를 평가할 수 있게 해 줍니다. 신뢰도 척도(Likert 또는 슬라이더)를 대상 어노테이션 스키마와 결합하여, 연구자가 어노테이터가 무엇을 선택했는지뿐만 아니라 그 선택에 얼마나 확신했는지까지 측정할 수 있게 합니다.

개요

신뢰도 어노테이션은 어노테이션 품질을 연구하고, 모호한 항목을 식별하며, 집계 과정에서 레이블에 가중치를 부여하는 데 필수적입니다. 구성되면 신뢰도 평가 위젯이 대상 어노테이션 옆에 나타나, 어노테이터가 자신의 결정에 얼마나 확신하는지 표시하도록 안내합니다.

빠른 시작

yaml
annotation_schemes:
  - annotation_type: radio
    name: sentiment
    description: What is the sentiment of this text?
    labels: ["Positive", "Negative", "Neutral"]
 
  - annotation_type: confidence_annotation
    name: sentiment_confidence
    description: How confident are you in your sentiment label?
    target_schema: sentiment
    scale_type: likert
    scale_points: 5

구성 옵션

필드유형기본값설명
annotation_typestring필수"confidence_annotation"이어야 합니다
namestring필수이 스키마의 고유 식별자
descriptionstring필수어노테이터에게 표시되는 안내문
target_schemastring선택이 신뢰도 평가가 적용되는 어노테이션 스키마의 이름
scale_typestring"likert"척도 유형: 이산 점수에는 "likert", 연속 척도에는 "slider"
scale_pointsinteger5Likert 척도의 점 개수(슬라이더에서는 무시됨)
labelsarray선택척도 점에 대한 사용자 지정 레이블(예: ["Not confident", "Very confident"])
slider_mininteger슬라이더의 최솟값(scale_type"slider"일 때만 사용됨)
slider_maxinteger슬라이더의 최댓값(scale_type"slider"일 때만 사용됨)
label_requirement.requiredbooleanfalse다음으로 넘어가기 전에 신뢰도 평가를 완료해야 하는지 여부

예시

Likert 신뢰도 척도

yaml
annotation_schemes:
  - annotation_type: radio
    name: toxicity
    description: Is this comment toxic?
    labels: ["Toxic", "Not Toxic"]
 
  - annotation_type: confidence_annotation
    name: toxicity_confidence
    description: How confident are you in your toxicity judgment?
    target_schema: toxicity
    scale_type: likert
    scale_points: 5
    labels: ["Not at all confident", "Slightly confident", "Moderately confident", "Very confident", "Extremely confident"]

슬라이더 신뢰도 척도

yaml
annotation_schemes:
  - annotation_type: radio
    name: stance
    description: What stance does the author take?
    labels: ["Support", "Oppose", "Neutral"]
 
  - annotation_type: confidence_annotation
    name: stance_confidence
    description: Rate your confidence from 0 (guessing) to 100 (certain).
    target_schema: stance
    scale_type: slider
    slider_min: 0
    slider_max: 100

필수 신뢰도 평가

yaml
annotation_schemes:
  - annotation_type: multiselect
    name: topics
    description: Select all topics that apply.
    labels: ["Politics", "Economy", "Health", "Education"]
 
  - annotation_type: confidence_annotation
    name: topics_confidence
    description: How confident are you in your topic selections?
    target_schema: topics
    scale_type: likert
    scale_points: 3
    labels: ["Low", "Medium", "High"]
    label_requirement:
      required: true

독립형 신뢰도(대상 없음)

신뢰도 어노테이션은 일반적인 자기 평가를 위해 대상 스키마 없이도 사용할 수 있습니다:

yaml
annotation_schemes:
  - annotation_type: confidence_annotation
    name: task_familiarity
    description: How familiar are you with this topic area?
    scale_type: likert
    scale_points: 5
    labels: ["Not familiar", "Slightly familiar", "Somewhat familiar", "Very familiar", "Expert"]

출력 형식

json
{
  "toxicity_confidence": {
    "labels": {
      "confidence": 4
    }
  }
}

Likert 척도에서는 값이 1부터 scale_points까지의 범위를 가집니다. 슬라이더에서는 값이 slider_min부터 slider_max까지의 범위를 가집니다.

모범 사례

  1. 항상 대상 스키마와 결합하세요 - 신뢰도 평가는 특정 어노테이션 결정과 연결될 때 가장 유용합니다
  2. 단순함을 위해 Likert를 사용하세요 - 이산 척도는 어노테이터가 더 빠르고 쉽게 사용할 수 있습니다
  3. 세밀한 측정을 위해 슬라이더를 사용하세요 - 후속 분석을 위해 정밀한 신뢰도 값이 필요할 때 적합합니다
  4. 신뢰도를 필수로 설정하세요 - 선택적 신뢰도 평가는 자주 건너뛰게 되어 데이터의 유용성이 떨어집니다
  5. 신뢰도 패턴을 분석하세요 - 낮은 신뢰도 항목은 판정이나 추가 어노테이션의 좋은 후보입니다

더 읽어보기

구현 세부 사항은 원본 문서를 참조하세요.