본문 바로가기
728x90
반응형

데이터가공2

2023년 "인공지능 데이터 구축 사업" 동향과 변화 정부의 "인공지능 데이터 구축 사업"이 5개년을 목표로 출발하여 23년에 3년 차가 되었습니다. 며칠 전에 발표한 확정안을 토대로 예산의 규모와 과제의 규모 등을 알아보겠습니다. 1. 사업규모 및 운영 부문 정부 지원 예산 및 과제 규모가 대폭 축소되었습니다. 22년도에 비해 예산과 데이터의 종류와 개수 모두 절반이상 줄었으며 이 마저도 수정을 거듭하며 결국 2천억대 초반까지 감축했습니다. 연도별 데이터 규모를 보면 21년에 190종, 22년에는 310종으로 가장 많은 데이터를 수집하였고 23년은 작년의 절반 수준입니다. 22년에는 1,2,3차로 나누어 진행할 만큼 대규모 사업이 많았고 23년에는 규모가 줄어든 걸 반영해서 단 1회로 진행합니다. 일정의 변화 사업 초반 일정의 지연으로 전체 일정이 변화가.. 2023. 4. 16.
데이터 라벨링이란? 데이터 라벨링이란 무엇입니까? 데이터 라벨링은 기계 학습 알고리즘에 데이터를 더 유용하고 유익하게 만들기 위해 이미지, 텍스트 또는 오디오와 같은 데이터 세트에 하나 이상의 설명 태그 또는 라벨을 수동, 자동으로 할당하는 프로세스입니다. 이러한 태그 또는 레이블은 데이터를 분류 또는 범주화하고, 패턴 또는 경향을 식별하거나, 추가 컨텍스트 또는 의미를 제공하는 데 사용될 수 있습니다. 데이터 레이블 지정은 기계 학습 알고리즘이 정확하고 관련성 있는 데이터와 함께 작동하는지 확인하는 데 도움이 되므로 기계 학습 파이프라인에서 중요한 단계입니다. 적절한 레이블 지정이 없으면 머신 러닝 모델이 데이터의 패턴을 정확하게 인식하거나 분류하지 못하여 부정확한 예측이나 결정을 내릴 수 있습니다. 데이터 라벨링은 사람.. 2023. 4. 16.
728x90
반응형