이미지 어노테이션

Potato에서 이미지를 어노테이션하는 방법. 분류, 다중 라벨 태깅, 바운딩 박스, 폴리곤, 랜드마크와 COCO/YOLO로의 내보내기를 설명합니다.

이미지 어노테이션은 이미지당 하나의 라벨을 붙이는 것에서부터 픽셀 위에 정밀한 영역(박스, 폴리곤, 점)을 그리는 것까지 폭넓습니다. 적절한 수준은 모델이 무엇을 필요로 하는지에 달려 있습니다. 분류기에는 라벨이, 검출기에는 바운딩 박스가, 세그멘테이션 모델에는 폴리곤이 필요합니다. 기능 레퍼런스는 이미지 어노테이션을 참조하십시오.

이미지 전체 분류와 태깅

라벨이 하나면 radio를, 여러 개면 multiselect를 사용합니다. 이미지 분류 쇼케이스가 동작하는 실제 예시입니다.

yaml

annotation_schemes:
  - annotation_type: multiselect
    name: contents
    description: "Select everything visible in the image."
    labels: [Person, Vehicle, Animal, Building, Vegetation]

영역: 박스, 폴리곤, 랜드마크

위치를 특정할 때는 작업자가 이미지 위에 직접 그립니다.

바운딩 박스는 객체 검출용입니다.
폴리곤은 이미지 세그멘테이션용으로, 객체의 형태가 중요할 때 사용합니다.
랜드마크 / 키포인트는 자세와 얼굴용입니다.

Potato의 이미지 어노테이션은 이러한 영역 유형을 클래스별 색상과 함께 지원하며, 이는 텍스트의 스팬 어노테이션이 동작하는 방식과 같습니다.

경계와 라벨링 규칙

빈틈없음. 박스가 객체에 딱 맞게 붙는가, 아니면 여백을 포함하는가? 일관성을 유지하십시오.
가림과 잘림. 일부가 가려진 객체를 어떻게 박스 처리할지 정합니다.
작은 객체와 밀집 장면. 최소 크기와 밀집한 장면을 위한 규칙을 설정합니다.

이러한 규칙은 그리기 도구 자체보다 훨씬 더 일치도를 좌우합니다.

비전 모델용으로 내보내기

Potato는 이미지 어노테이션을 COCO와 YOLO 형식으로 내보내며, 검출 및 세그멘테이션 학습 파이프라인이 이를 곧바로 읽어 들입니다. ML용으로 어노테이션 내보내기를 참조하십시오.

이미지 어노테이션

이미지 전체 분류와 태깅

영역: 박스, 폴리곤, 랜드마크

경계와 라벨링 규칙

비전 모델용으로 내보내기

더 읽어보기