데이터라벨링은 크게 두 가지 종류로 나눕니다.
AI 교육에 사용될 자료를 수집하는 것과 이 수집된 자료를 가공하는 것이죠.
데이트 수집
먼저 수집을 다시 세분화하면 위와 같습니다.
수집은 사진이나 동영상을 찍는 촬영이 있고, 음성이나 필요한 소리를 녹음하는 작업도 있으며, 특정 상황에 맞게 문장을 발화하는 글쓰기, 프로젝트와 연관된 설문 등이 있습니다.
데이트 가공
데이터 가공은 가장 쉽고 간단한 바운딩부터, 세그멘테이션, 키포인트, 폴리곤 등으로 세분화 할수 있습니다.
1. 바운딩
가이드에 맞게 사각형 박스를 만드는 가장 흔하고 간단한 작업입니다. 현재 여러 플랫폼에서 체험을 할 수 있으며 체험을 하시고자 하시면 아래 '라벨온 바로가기'를 클릭하시고 회원가입 하시면 됩니다.
회원가입 후 상단 메뉴에서 "이용가이드" "체험하기" 순으로 클릭을 하시면 됩니다.
그럼 두번째 사진을 화면으로 보실 수 있으며 해당 화면에서 체험하기를 클릭합니다.
알림 창이 뜨면 "확인"을 클릭하시고 작업창으로 이동합니다.
이제 작업하기에 앞서 가이드를 꼼꼼히 읽어 봐야 합니다.
같은 바운딩 작업이라도 프로젝트마다 요구사항이 다르므로 가이드는 처음부터 끝까지 정독하고 모르는 부분은 다시 체크해 보시는 게 반려와 실패를 줄이는 지름길입니다.
2. 세그멘테이션
세스멘테이션 작업은 객체의 모양에 따라 점을 연속적으로 찍어 많은 점이 모여 선으로 연결되는 작업입니다.
바운딩과 비교를하면 바운딩은 사각형의 네 모서리 부분만 점을 찍으면 되지만 세그멘테이션은 바운딩보다 훨씬 많은 점이 필요합니다. 아래 예시 사진을 보면 한눈에 봐도 소를 모양에 따라 작업을 한 것을 볼 수 있습니다.
3. 키포인트
키포인트의 경우 사람의 움직임이나, 표정 등을 읽을 때 사용하는 라벨링 방법입니다.
보통은 각 관절이나 원하는 포인트에 순서대로 점을 찍어 작업하는 방식이 많습니다.
위 예시를 보면 1번부터 13번까지 모든 점을 찍어야하며 1번은 입에 그리고 마지막 13번은 오른쪽 발굽에 점을 찍어야 합니다. 키포인트가 보기에는 쉬워도 막상 작업을 하면 관절을 찾기가 어려워 반려를 많이 받는 작업 중에 하나입니다.
4. 폴리곤
폴리곤은 바운딩과 세스멘테이션의 중간 정도의 난이도로 보시면 쉽게 이해하실 거라고 생각합니다.
바운딩은 사각형으로 네개의 모서리가 정해져 있지만 폴리곤은 작업자의 작업에 따라 오각형, 육각형 등의 모양을 가질 수 있습니다.
위 이미지를 클릭하시면 AIWORKS에서 운영하는 기본적인 교육을 들으실수 있으며 4장에 폴리곤이 포함되어 있습니다. 보시면 충분히 어떤 작업인지 이해하실 수 있습니다.
5. 분류/판별
분류/판별은 가이드에 따라 속성 혹은 카테고리별로 구분하여 전사하는 작업을 합니다.
예를 들면 사람으로 가득찬 지하철 사진을 주고 남자와 여자 혹은 노인과 청년, 어린아이로 분류하라는 프로젝트가 있다면 분류/판별에 해당됩니다.
위 캡쳐는 현재 크라우드웍스에서 진행되는 프로젝트를 예시를 들기 위해 가져왔습니다.
6. 글쓰기
특별한 상황을 가이드에 안내해 주고 그 상황에 맞는 글쓰기를 하는 프로젝트입니다.
아래 캡쳐는 현재 참가 중인 프로젝트를 예시로 가져왔습니다.
"페르소나를 이용한 시니어와 AI 대화문 만들기" 프로젝트는 AI와 시니어가 총 11번의 대화를 주고받는 대화문을 작성해야 하며 각 대화당 최소 30자, 최대 40 사이에서 작성해야 되는 프로젝트입니다.
'데이터라벨링' 카테고리의 다른 글
'1위' 데이터 라벨링 플랫폼, 크라우드웍스, AIDE 자격증 (2) | 2023.04.27 |
---|---|
단가는 낮지만 다양한 종류의 라벨링을 제공하는 플랫폼 - 에이모(구 라벨러스) (0) | 2023.04.27 |
데이터라벨링 3월까지 참여한 프로젝트 정리 (0) | 2023.04.26 |
2023년 "인공지능 데이터 구축 사업" 동향과 변화 (0) | 2023.04.16 |
데이터 라벨링이란? (0) | 2023.04.16 |
댓글