728x90 반응형 데이터라벨링36 자연어 처리 프로젝트 텍스트 개체명 인식 NER 데이터라벨링 개체명 인식(Named Entity Recognition, NER)은 텍스트 라벨링 작업 중에서도 중요한 분야로, 문서에서 특정한 의미를 가진 단어나 문구를 찾아내고 이를 지정된 범주로 분류하는 작업을 말합니다. NER은 "이름을 가진 개체를 인식"한다는 의미로, 우리가 일상적으로 접하는 문서 속에서 특정 클래스에 해당하는 단어들을 찾아내어 이를 라벨링 합니다.예를 들어 사람, 회사, 장소, 시간 등 미리 정의된 개체를 문장에서 식별하고 분류하여, 그 단어가 지닌 구체적인 의미를 밝히는 것이 NER의 주된 목적입니다. 이러한 작업은 텍스트에 내재된 의미를 명확히 파악하고자 하는 자연어 처리(NLP) 시스템에서 특히 중요한 역할을 하며, 다양한 분야에서 텍스트 데이터의 분석 및 자동화를 위한 기초로 활용됩.. 2024. 11. 4. 틱택코리아 Tictag 데이터 라벨링 플랫폼 앱 최근에 새로운 데이터 라벨링 회사를 알게 되어 소개하고자 합니다. 회사 이름은 틱택코리아입니다. 저도 처음에는 생소해서 검색을 해보니까 24년에도 데이터바우처 사업에 선정된 제법 규모가 있는 회사였습니다. 틱택은 다른 플랫폼처럼 어플을 이용해 라벨러를 모집합니다.그래서 더 많은 작업을 원하신다면 틱택어플을 다운 받아야합니다. 다운로드하는 방법은 구글 앱 스토어에서 틱택을 검색하시면 되겠습니다. "데이터 라벨링, 어떻게 시작하는 건데? 답은 바로, 틱택! Tictag과 함께라면 데이터 라벨링, 누구나 시작할 수 있습니다"라는 소개 글이 보입니다. 혹시라도 찾기가 어려우시다면 아래 이미지를 클릭하시면 링크에 바로 가서 다운로드할 수 있습니다. 설치하고 보니 2개의 프로젝트가 있어서 지원을 했는데 결과는 어떨.. 2024. 6. 20. 24년 데이터 라벨링 초거대 AI 확산 생태계 조성 사업 시작과 전망 2024년부터 초거대 AI 확산 생태계 조성 사업이 시작될 예정입니다. 이에 맞춰 2023년까지 정부에서 진행해 온 'AI 학습용 데이터 구축사업'의 예산이 0원입니다. 24년 데이터 라벨링 시장의 전망은 어떨지 예측해 보겠습니다. 관련 자료는 글 하단에 첨부합니다. 초거대 AI 확산 생태계 조성 사업 2022년에 챗GPT를 포함한 생성형 AI가 등장하면서, 마이크로소프트의 코파일럿과 네이버의 하이퍼 크로버 X 등이 급속히 발전하여 초거대 AI 중심의 AI 산업 재편이 이루어지고 있습니다. 생성형 AI는 기존 콘텐츠를 활용하고 학습하여 새로운 콘텐츠를 만들어내는 기술을 말합니다. 이에 따라 2024년부터는 AI 학습용 데이터 구축 사업을 종료하고 초거대 AI 확산 생태계 조성 사업으로 대체될 예정입니다... 2024. 3. 17. 데이터 라벨링을 시작하시는 분들에게 입문에 대하여 레벨링 후기 지금도 많은 분들이 데이터 라벨링 부업을 시작하려고 하는데, 어떻게 해야 할지 모르겠다고 하는 분들이 많으신 것 같습니다. 그래서 데이터 라벨링 부업 초보자 혹은 입문자분들이 이 글을 통해서 데이터 라벨링의 전체적인 흐름을 볼 수 있도록 하는 글을 써볼까 합니다. 질문에 간단하게 답을 하는 형식으로 진행되며 설명이 부족하면 다른 글을 참조하시면 좋을 것 같습니다. 자격증은 필요한가요? 데이터 라벨링이란 인공지능 알고리즘 고도화를 위해 AI가 스스로 학습할 수 있는 형태로 데이터를 가공하는 작업을 데이터 라벨링이라고 합니다. 최근 생성형 AI의 등장으로 AI에게 비가공 데이터를 주고 AI가 사람의 지시 없이 데이터 패턴을 학습하는 형태의 비 라벨링 데이터 방향으로 흐름이 점점 변하고 있습니다. 데이터 라벨.. 2024. 2. 2. 데이터 라벨링 2023년 느낀 점과 경험 정리 현재 2024년 1월입니다. 데이터 라벨링 업계가 현재 어떤 상황인지 정리해 보도록 하겠습니다. 2023년은 2022년과 비교해서 어땠고 2024년은 어떨지를 예상해 보겠습니다. 2023년부터 출퇴근 요구 여러 종류의 데이터 라벨링 일이 있습니다. 간단한 BBOX부터 음성 전사, 음성 녹음 그다음에 OCR 등 라벨링은 현재 점점 더 전문화되고 있습니다. 최근에 데이터 라벨링 알바를 하고 계신 분들이 굉장히 많으세요. 연령 불문하고 굉장히 많으신데, 2021년에 코로나 때문에 거의 바깥 활동이 불가능했었죠. 그래서 이때 데이터 라벨링이 재택근무로 굉장히 각광을 받았어요. 그 당시에는 재택근무만으로도 밖에 나가서 돈을 버는 것만큼의 수익을 올릴 수가 있었습니다. 그런데 2023년이 들어서면서 코로나는 이제 .. 2024. 1. 20. 뉴워커 온라인 데이터 구축 설문조사 대상자 모집 뉴워커에서 온라인 데이터 구축을 위한 설문조사 대상자를 아래와 같이 모집합니다. 간단한 설문조사 방식으로 1차와 2차로 나눠 두 차례 집행됩니다. 관심 있으신 분들은 아래에 구글폼을 이용해 신청하시면 됩니다. 시금부터 신청 조건과 작업 내용 그리고 참여하면 얼마를 받을 수 있는지 안내해 드리겠습니다. 신청 조건 먼저 신청 조건부터 알아보겠습니다. 이번 조사는 갤럭시 워치 4 이상의 수면 시 수면 상태를 측정할 수 있는 기기가 있는 분으로 나이는 20세부터 50세까지 참여 가능합니다. 이외의 나이대는 현재 참가자 모집이 마감되었습니다. 참여자는 1차와 2차에 모두 참여 가능하신 분을 우선적으로 선발하며 선발되어도 1차 작업 시 불성실하거나 기타 조건에 미치지 못하면 2차에 참여가 불가합니다. 1차와 2차에.. 2023. 12. 12. 프리랜서번역가 한국어 수정 교정 데이터라벨링 플리토 FLITTO 플랫폼 한국어 할 줄 아시나요? 그러면 여러분은 부업할 준비가 되셨습니다. 네? 무슨 소리냐고요. 여기 한국어만 잘할 줄 아신다면 자투리 시간을 활용해서 틈틈이 언제 어디서든 편하게 작게나마 돈을 벌 수 있는 방법이 있습니다. 이 글을 읽어 보시면 쉽게 참여할 수 있으며 알맞은 조언까지 모두 챙겨가실 수 있습니다. 번역 데이터라벨링 지금 소개할 데이터라벨링은 번역입니다. 외국어를 할 줄 모른다고 걱정하지 마세요. 이미 번역이 된 글에서 어색한 부분을 찾아 고쳐주거나 맞춤법이 틀린 부분을 수정하면서 AI를 더 정확하게 만드는 작업입니다. 정말로 한국어만 할 수 있다면 준비 끝입니다. 플리토(FLITTO)라는 사이트를 소개해 드립니다. 플리토는 간단한 문장들을 번역하고 번역하는 만큼 돈을 벌 수 있는 플랫폼인데요... 2023. 12. 12. 외국계기업 음성녹음 데이터라벨링 프로젝트 TELUS International 외국계 회사에서 진행하고 있는 한국어 음성 녹음 프로젝트를 소개해 드립니다. 아시는 분들은 패스해 주시고요. 바로 TELUS라는 회사에서 진행 중인 프로젝트에 진행과 참여방법 그리고 페이에 대해 알려드리겠습니다. 그럼 바로 시작합니다. 프로젝트 소개 해당 작업은 한국어로 대화를 녹음하는 것입니다. 작업에 참여하려면 파트너가 필요합니다. 결혼을 하셨다면 부부가 함께 참여할 수 있고 가족 중 한 명과 짝을 이뤄도 됩니다. 이외에 친구나 지인 등 한국인이라면 모두 가능합니다. 파트너가 있다면 좋겠지만, 파트너를 찾을 수 없는 경우, 다른 1인 참가자 중에서 파트너를 찾아 주기도 합니다. 하지만 회사에서는 이를 보장할 수 없으며, 쌍을 이루어 참여신청을 하신 분들부터 우선으로 참여 기회를 제공합니다. 따라서 회.. 2023. 11. 26. 데이터 라벨링 무료 교육 종료 정부 지원 예산 삭감 사기 주의 올해도 벌써 11월이고 이제 두 달도 채 남지 않았습니다. 지금 시점에서 데이터 라벨링에 관심을 가지고 시작하는 분들이 꼭 알아야 하는 부분에 대해서 이야기해보려고 합니다. 데이터 라벨링 무료 교육 종료 첫 번째는 데이터 라벨링 내일 배움 카드 무료 교육이 23년 올해에 종료됩니다. 데이터 라벨링 내일 배움 카드 교육은 플랫폼 종사자 특화 훈련의 일환으로 국비 지원을 받아 무료로 교육을 수강할 수 있었습니다. 올해 7월 내일 배움 교육 과정이 종료 예정이라고 알고 있었는데요. 교육은 올해 12월까지로 연장되었으나 올해를 마지막으로, 데이트 라벨링 교육에 대한 국비 지원이 더 이상 진행되지 않는다고 합니다. 새로운 일에 도전할 때 어떤 길잡이가 될 수 있는 내일 배움 카드 무료 교육이 사라진다는 건 너무나.. 2023. 11. 11. 9월까지 참여한 프로젝트 후기 방문 녹음/단순 바운딩/타이핑 7월부터 채용공고가 비수기 기간보다는 확실히 많이 올라오고 있습니다. 하지만 재택보다는 출퇴근 공고도 수가 더 많은 것 같습니다. 데이터 라벨링의 가장 큰 장점이 재택이었는데, 코로나가 완전히 끝나진 않았지만, 일상생활로 돌아간 영향이 있는 걸까요? 챗 GPT의 출현 때문일까요? 데이터 라벨링 치열한 경쟁 전문가는 아니기 때문에 확실한 답을 하긴 어렵지만 두 가지 모두 영향이 있을 거라고 추측해 봅니다. 그래도 이전보다는 더 많은 작업에 참여할 수 있어서 다행이라 생각합니다. 저는 채용 사이트에서 지원하는 걸 선호하는데, 올해는 크라우드웍스 등 라벨링 플랫폼에도 관심을 가져보고는 있습니다. 크라우드웍스만 봐도 프로젝트 수가 늘어난 걸 볼 수 있었지만, 자격증이 있어도 더 높은 등급의 자격을 요구해 조건 .. 2023. 10. 15. 이전 1 2 3 4 다음 728x90 반응형