본문 바로가기
728x90
반응형

데이터라벨링36

AI 데이터, 성능과 안정성을 반복하는 핵심 AI 모델을 구축하고 훈련시키기 위해 데이터는 AI 모델이 패턴 학습을 하고 예측을 실천하는 데 있어서 중요하며 이를 통해 모델이 다양한 상황에 대응하고 더 높은 정확도를 만듭니다. 따라서 AI 모델의 성능과 유연성을 발휘할 수 있고 확실한 데이터를 확보하는 것이 매우 중요합니다. 데이터라벨링의 필요성 이를 나타내는 라벨링 작업이 필요합니다. 라벨링은 데이터에 적합한 출력 또는 태그를 지정하는 과정입니다. 예를 들어 실습을 위한 AI 모델을 훈련하기 위해 시위의 길이, 높이, 크기 등을 정밀 라벨링하고 이렇게 작업된 라벨링으로 AI 모델이 표준을 측정할 수 있도록 도와줍니다. 하지만 단순히 라벨 작업만으로는 완성되지 않습니다. 데이터셋에는 더 많은 학습 데이터와 다양한 사례가 포함되어 있는 검수 단계에서.. 2023. 7. 27.
오픈을 준비 중인 플랫폼 라벨그라운드 5월 30일 오픈을 예고한 데이터라벨링 플랫폼 사이트가 있어 소개하고자 합니다. 검색을 통해 알아본 봐로는 신생 기업이 아니라 AI업계에 오랫동안 몸담고 생태계 조성을 해온 회사가 모기업으로 그동안 쌓은 많은 경험을 이제 라벨링으로 까지 넓혀가나 봅니다. 라벨그라운드 소개 라벨그라운드(Label Ground)는 운동장에서 뛰어노는 것처럼 누구나 그라운더(작업자)가 되어 데이터 라벨링의 재미를 느낄 수 있도록 서비스를 제공하는 크라우드소싱 방식의 플랫폼입니다. 그라운더(작업자)가 빠르고 정확한 작업을 수행해 높은 품질의 데이터를 생산할 수 있도록 라벨링 교육과 다양한 데이터 유형별(이미지, 음성, 영상, 텍스트 등) 최적화된 라벨링 도구 40가지 이상을 제공합니다. 기업이 데이터 구축 및 관리를 위한 시간.. 2023. 5. 25.
여행로그 크라우드워커(여행자) 모집 당신의 국내 여행 기록을 제공하고, 데이터 제공비용르 지원받으세요! 여행로그에서 크라우드워커(여행자) 모집을 시작합니다. 금번 모집은 1차 모집이니 여행 계획이 있으시거나 관심 있는 분들의 많은 지원 바랍니다. 여행로그 서비스는? 사전 선정된 여행자는 앱 설치 후, 여행하면서 각종 여행 기록(GPS, 구매정보) 등 데이터 기록 및 제공을 하셔야 합니다. 기록 및 제공 여행 데이터는 향후 관광분야 AI알고리즘 개발에 활용됩니다. 크라우드워커(여행자) 모집 사전 응모하여 선정 되신 분들에 한하여, 여행로그 앱(APP) 설치 후, 여행기간 동안 여행데이터를 제공하면, 6만8천원 ~ 21만6천원 여행데이터 제공비용이 지급됩니다. 여행 기간에 따른 데이터 제공비용 차등 지급 모집 대상 만 19세 이상 대한민국 국.. 2023. 5. 19.
데이터라벨링과 전반적인 프로세스 정리 데이터 라벨링과 라벨링 사업에 대한 전반적인 이해를 도울 수 있도록 대략적인 프로세스에 대해 알려드립니다. ‘데이터 라벨링’이 무엇인지 궁금한 분들께도 도움이 될 수 있도록 친절한 설명을 담았습니다. ‍그럼 시작해 보겠습니다. 데이터 라벨링, 대충 알고는 있지만 정확히 알려주세요. 데이터 라벨링에 대해 간단히 짚고 넘어가 볼게요. 데이터 라벨링이란, 비정형데이터(이미지, 비디오, 오디오, 텍스트 등)를 인공지능이 학습할 수 있는 형태로 가공하는 작업입니다. 인공지능이 공부할 수 있는 연습문제와 정답지 세트를 만들어 주는 것이라고 생각하면 쉽습니다. 예를 들어, 이미지 내 오브젝트에 꼭 맞게 박스를 그리거나 누끼를 따듯이 점을 연결한 뒤, Person, Animal, Car 등의 라벨을 달아 기계가 이해할.. 2023. 5. 19.
머신러닝과 선형회귀, 선형회귀 예측 이번에는 최근 빅데이터 해석 및 예측을 위한 도구로 각광받고 있는 머신러닝(또는 기계학습)에 대하여 소개하고자 합니다. 아울러, 여러 서비스에서 이것을 어떻게 활용하고 있는지 알아보겠습니다. 머신러닝 머신러닝은 인공지능의 한 분야로, 컴퓨터가 학습할 수 있도록 하는 알고리즘과 기술을 개발하는 것을 말합니다. 기존에는 컴퓨터가 입력값을 받으면 결괏값을 출력하는 방식으로 프로그램을 구성하였다면 인공지능은 기존의 입력값과 결과값을 가지고 컴퓨터가 학습을 통하여 데이터셋의 경향성 및 유의성을 파악한 다음 새로운 데이터셋이 주어졌을 때 결과를 예측할 수 있도록 합니다. 컴퓨터 학습을 위한 방법으로는 주로 통계적 방법을 활용하며, 이를 통하여 데이터에서 법칙성을 추출하고 새로운 정보에 대하여 결과를 예측, 분류합니.. 2023. 5. 17.
딥러닝은 뉴런과 시냅스의 병렬연산을 컴퓨터로 재현하는 방법 2016년, 바둑기사 이세돌과 알파고와의 바둑 대국이 세계적인 이슈가 되었고 이 대국을 통해 딥러닝이라는 단어를 처음 접하고 수많은 사람들에게 알려지게 되었습니다. 딥러닝이 대체 뭐길래 이렇게 화제가 되고 얘기가 나오는 것일까요? 딥 러닝의 개념 우선, 딥 러닝의 상위 개념인 머신러닝에 대해 알아보겠습니다. 머신러닝Machine Learning 이란 딥 러닝의 상위 개념으로, 컴퓨터가 스스로 학습해 정답을 예측하는 인공지능의 분야입니다. 딥 러닝Deep Learning 은 인간의 신경망의 원리를 모방한 심층신경망 이론을 기반해 고안된 머신러닝 방법의 일종입니다. 딥 러닝이 기존의 통계학이나 다른 머신러닝 방법과 다른 큰 차이점은 인간의 뇌를 기초로 하여 설계되었다는 점입니다. 인간은 컴퓨터가 아주 짧은 .. 2023. 5. 16.
음성 녹음 프로젝트 전화통화 녹음 알바몬에서 검색을 하다 발견한 데이터 수집 프로젝트입니다. 주기적으로 채용 사이트를 둘러보지만 30개 정도 지원을 하면 하나의 프로젝트에 참여하는 것 같습니다. 점점 바늘구멍으로 들어가네요. 지원 조건 AI 대화 음성인식 성능 향상을 위한 데이터 수집의 일환으로 전화 통화 음성 녹음자 모집합니다. 지인과의 전화통화 녹음 지인과 전화통화시에 '통화 녹음' 버튼 클릭 후 저장된 파일을 전송. (안드로이드 스마트폰에서 기본 제공되는 녹음 기능을 사용해야 함) 파일확장자가 m4a 나 3gp로 나와야 정상적인 파일입니다. 대화하는 두 사람 중 한 분이 아이폰이거나 유선전화인 건 상관없음. 대화 주제 : 관심사, 학과 전공, 대학생활, 취미생활, 회사 업무, 정치, 경제, 재테크(주식), 부동산, 금융, 보험, 예.. 2023. 5. 15.
시니어의 상태가 드러나는 문장 작성하기 프로젝트 날이 갈수록 크라우드웍스에서 프로젝트에 참여하기가 어렵다. 사전테스트를 거치고 통과를 해도 사전 검증이 기다리는 프로젝트도 많고 각 단계별 시험을 통과하려면 여러 번 동영상 강의를 들어야 하니 말이다. 시니어의 상태가 드러나는 문장 작성하기 프로젝트 프로젝트 이름을 보면 알겠지만 해당 프로젝트는 문장을 만드는 라벨링이다. 다른 말로는 문장발화라고 하며 간단하게 프로젝트를 소개부터 해보겠다. 프로젝트 개요 1. 시니어는 만 65~74세의 노인으로 정의합니다. 2. 시니어는 신체적/심리적으로 불안정한 상태라고 가정합니다. 시니어는 신체적 증상/치매 유사 증상/ 심리적 증상 또는 경제적 고립을 겪고 있습니다. 시니어의 어려움은 오랫동안 지속된 상황입니다. 3. 시니어가 AI에게 자신의 상황을 이야기하는 문장을.. 2023. 5. 15.
Cuboid 3D 데이터라벨링과 Point Cloud 학계에서 Point Cloud 데이터를 다루는 3D 인공지능은 최근 몇 년 사이 눈부신 발전을 이루었다. 덕분에 현재 3D 인공지능은 자율주행, HD 맵 제작, 로봇 주행, 3D 스캐닝, 3D 컨텐츠 개발 등 다양한 산업에서 유용하게 사용되고 있다. 앞으로는 각 산업의 시장성과 기술 발전 및 문제 해결에 3D 인공지능이 큰 기여를 할 것으로 기대된다. 하지만, 3D 인공지능을 다루는 각 산업의 발전 속도는 기대에 비해 여전히 더딘 상황이다. 3D 데이터에 대한 진입 장벽이 다른 데이터에 비해 매우 높기 때문이다. 상당히 고가인 수집 장비, 3D 데이터 포멧 및 표준화 문제, 다루기 어려운 응용 소프트웨어 문제 등이 여전히 남아 있다. 이는 인공지능 학습을 위한 데이터셋 구축 역시 마찬가지이다. 앞서 언급.. 2023. 5. 14.
새로운 게임 체인저, 텍스트 생성 AI와 그 파급력 몇 달 전 MS가 ChatGPT의 OpenAI사에 100억 달러 투자를 결정하고 자사 포털 사이트 Bing에 ChatGPT 탑재를 결정하면서 두 빅테크의 동맹이 현실화되었습니다. 이에 뒤질세라 Google에서는 서둘러 자사의 알고리즘(Lambda)에 기반한 Bard 출시를 발표하였습니다. 이처럼 최근 빅테크를 중심으로 한 인공지능 업계 최대의 화두는 단연 '생성 AI(Generative AI)' 일 것이다. 그렇다면 FAANG(Facebook(Meta), Apple, Amazon, Netflix, Google)와 같은 빅테크 기업들은 왜 생성 AI에 역량을 집중하고 있는 것일까? 또 생성 AI가 무엇인지, 그리고 그것이 우리 생활을 어떻게 바꾸어 놓을지 미리 맛보기를 해보는 시간을 가져보겠습니다. 생성(.. 2023. 5. 14.
728x90
반응형