현재 2024년 1월입니다. 데이터 라벨링 업계가 현재 어떤 상황인지 정리해 보도록 하겠습니다. 2023년은 2022년과 비교해서 어땠고 2024년은 어떨지를 예상해 보겠습니다.
2023년부터 출퇴근 요구
여러 종류의 데이터 라벨링 일이 있습니다. 간단한 BBOX부터 음성 전사, 음성 녹음 그다음에 OCR 등 라벨링은 현재 점점 더 전문화되고 있습니다. 최근에 데이터 라벨링 알바를 하고 계신 분들이 굉장히 많으세요. 연령 불문하고 굉장히 많으신데, 2021년에 코로나 때문에 거의 바깥 활동이 불가능했었죠. 그래서 이때 데이터 라벨링이 재택근무로 굉장히 각광을 받았어요. 그 당시에는 재택근무만으로도 밖에 나가서 돈을 버는 것만큼의 수익을 올릴 수가 있었습니다. 그런데 2023년이 들어서면서 코로나는 이제 거의 우리의 위협이 되지 않은 상태고요. 대부분의 데이터 라벨링 회사들이 출퇴근을 요구를 하고 있습니다. 출퇴근을 만약에 한다면 서울의 판교 부근이라든지 가산 디지털 단지나 구로 디지털 근처에 만약에 살고 계시거나 출퇴근이 가능하신 분들은 모르겠지만, 타 지역에 살고 있는 분들한테는 프로젝트를 구하기가 굉장히 어렵습니다.
경력자도 최저시급
그리고 운 좋게 괜찮은 회사에서 일을 한다면 하루 8시간을 일하면서 시간당 일만 원을 받는 분도 있습니다. 하루에 8만 원씩 받은 거죠. 하지만 최근에는 어떻게 변했냐면 작업 기간이 불분명합니다. 보통 1개월에서 3개월 정도 일한다고 명시를 해 놓고 있는데, 나는 8시간인 줄 알고 지원을 했는데 실제로 일을 해봤더니, 어떨 때는 하루에 두 시간 일하고 네 시간 일하고 이런 식이에요. 그러면 당연히 8만 원 미만으로 수익이 발생한다는 거죠. 이러면 최저시급보다 못한 수익을 받을 수밖에 없습니다. 그리고 많은 업체들이 인건비를 줄이기 위해서 최대한 시급을 낮춰서 최저시급으로 채용 공고를 올린 업체들이 되게 많아요. 나는 경력자인데 어떻게 최저시급을 받고 일하냐? 이런 생각이 분명 드실 거예요.
데이터 라벨링 가성비 최악
또 예전에는 하루 100건을 했던 200건을 했던 상관없이 시간당 만 원씩 줬었는데 현재는 건당으로 바뀌는 경우가 많아졌습니다. 건당이라는 게요. 라벨링 하나를 끝내면 50원 이런 식이에요. 하루에 몇천 개를 해야 겨우겨우 기존에 받던 수익에 근접한 수준이기 때문에 시간당 가성비는 현재 최악인 상황입니다. 그나마 예전 수익이 나는 경우도 진짜 드물고 하루에 몇천 건을 하고 최저 시급도 나오지 않는 경우가 허다합니다. 회사들이 주로 어느 지역에 몰려 있는지는 말씀을 드렸고요. 물론 간간이 지방에서 데이터 라벨링 알바를 구하는 회사들이 있기는 한데 너무 먼 지방이라서 거기까지 도저히 갈 수가 없죠.
자본금이 열악한 중소회사 난립
예전에는 데이터 라벨링 회사들이 어쨌든 인공지능과 관련된 소프트웨어를 만드는 회사다 보니까, 원래부터 소프트웨어를 만드는 회사들이 주로 이 일을 추진해 왔어요. 하지만 근래에는 소프트웨어 개발과는 전혀 무관한, 전혀 상관없는 분야의 회사가 갑자기 데이터 라벨링으로 사람들을 모집을 하는 경우도 많습니다. 어떤 프로젝트는 회사의 자본금이 떨어져서 오늘내일하는 그런 회사들이 급하게 정부 과제를 따서 정부의 지원을 받아서 사람들한테 일을 주고 있습니다. 그러니까 여기서 자금을 얼마 남겨서 회사를 운영하려고 하는 거죠.
그러다 보니까, 이 회사는 데이터 라벨링 프로젝트에 대한 기반이 거의 없는 상태라서 어떤 식으로 규칙을 정해서 이 사람에게 하루에 얼마만큼의 일을 줘야 되고 이런 체계적인 것들이 전혀 준비가 안 된 상태입니다. 게다가 담당자도 자기가 뭘 해야 할지 몰라서 혼선을 작업자에게 전가하고 있습니다. 이러다 보니까, 작업자는 열받죠. 제대로 된 회사에서 일을 하다가 이렇게 어버버하는 회사에서 갑자기 일을 하게 되면 정말 나 이거 해야 되나? 이런 생각 분명히 드실 거예요. 그런데 직접 일을 해보지 않으면 이 회사가 제대로 된 회사인지 부족한 회사인지 알 수가 없습니다.
전문 영역과 비전문 영역
현시점에서 데이터 라벨링은 크게 두 개의 분야로 나눌 수가 있는데요. 비전문 영역 그러니까 어떠한 특정 지식 없이 좋은 학교를 나올 필요도 없고 컴퓨터만 다룰 줄 알면 누구나 할 수 있는 작업이고요. 예를 들면, 글자가 있으면 글자 주변으로 점을 찍어서 이 부분을 하나의 박스로 만드는 작업인데 박스를 만드는 게 수백수천 개가 되는 거죠. 따라서 단순, 반복 업무기 때문에 굉장히 지루합니다. 그다음에 전문 영역이 있는데요. 요즘 전기차들이 대부분 자율 주행 기능을 가지고 있어요. 그래서 자율 주행을 할 수 있도록 경로를 정하는 일이라든지, 의학 분야에서 엑스레이 사진을 분석한다든지, 사람처럼 대화를 하는 인공지능을 만들기 위해서 문장을 미리 만들고 입력을 한다든지 이런 경우에는 질문과 답변을 데이터 라벨링 하는 사람이 하나하나 다 만들어줘야 돼요. 그리고 이런 경우는 아무나 할 수가 없습니다.
전문 영역은 인력 부족
전문 영역의 경우는 적어도 국문과나 관련 전공을 한 사람들만 모집을 하고 있기 때문에 국문과 외 다른 전공을 가지신 분들은 취업이 잘 안 됩니다. 그리고 외국어 관련한 인공지능 사업들이 있는데, 사실 기존에 하던 라벨링하고 크게 차이는 없는데 다만 그게 외국어로 바뀐 경우입니다. 영어, 일본어, 동남아어 이런 식으로 바뀌었거든요. 따라서 외국어를 자유자재로 할 수 있는 사람이 아니면 이 일도 역시 할 수가 없습니다. 자율 주행은 굉장히 난이도가 높은 편이고 의학도 적어도 의대생이 아니면 참여하기가 어려운 프로젝트가 많아요. 그런데 의대생들이 공부하기도 바쁜데 이런 데이터 라벨링이나 하고 있겠습니까? 이 경우는 거의 지원하는 사람이 없다고 봐야 되겠죠. 그래서인지 공고가 자주 올라왔습니다.
사람은 늘고 일자리는 대폭 감소
정리를 한번 해보도록 하겠습니다. 데이터 라벨링 일을 처음 시작할 때보다는 다양한 연령대의 많은 분들이 현재 이 일을 하고 계세요. 부업으로 보통 많이 하고 계시는데, 일반 회사를 다니는 것만큼의 수익을 내기는 상당히 어려운 상태고요. 그리고 사람은 늘었는데 일자리 개수가 대폭 감소를 했습니다. 채용 사이트, 알바몬, 알바천국 이런 데 들어가서 데이터 라벨링으로 검색을 해보면 업체는 되게 많은데 이런 조건, 저런 조건 다 제하고 나면 사실 몇 개 안 남고요. 그나마 몇 개 안 남은 업체들도 채용 공고가 항상 떠 있어요. 이 항상 떠 있다는 게 뭘 뜻이냐면 수시 채용이라고 볼 수도 있는데, 사람들이 일을 해보고 이거 정말 가성비가 너무 안 좋은데 이 회사 진짜 좀 별로야 이러면 사람들이 계속 빠져나가거든요. 사람이 빠져나가니까 다시 사람을 채워 넣어야 되잖아요. 그러니까 수시로 자주 채용한다는 회사는 그다지 좋지 않다고 추리를 할 수가 있습니다.
마무리
반면 전문 영역의 데이터 라벨링은 계속 채용을 했어요. 근데 비전문 영역은 예전보다 일자리가 크게 줄어들었고요. 그러다 보니까, 인공지능과 관련이 없는 분들한테는 데이터 라벨링이라는 일을 추천하기가 굉장히 어렵습니다. 이 직업은 인공지능 훈련이 끝나면 더 이상 일이 없습니다. 그래서 이 일의 수명이 길지 않을 것 같습니다. 그러다 보니까, 지금 상황이 이렇거든요. 2023년을 보내며 경험하고 느낀 점을 정리해 봤습니다. 감사합니다.
'데이터라벨링' 카테고리의 다른 글
24년 데이터 라벨링 초거대 AI 확산 생태계 조성 사업 시작과 전망 (2) | 2024.03.17 |
---|---|
데이터 라벨링을 시작하시는 분들에게 입문에 대하여 레벨링 후기 (1) | 2024.02.02 |
뉴워커 온라인 데이터 구축 설문조사 대상자 모집 (0) | 2023.12.12 |
프리랜서번역가 한국어 수정 교정 데이터라벨링 플리토 FLITTO 플랫폼 (0) | 2023.12.12 |
외국계기업 음성녹음 데이터라벨링 프로젝트 TELUS International (0) | 2023.11.26 |
댓글