본문 바로가기
데이터라벨링

Cuboid 3D 데이터라벨링과 Point Cloud

by 그린망고 2023. 5. 14.
반응형

학계에서 Point Cloud 데이터를 다루는 3D 인공지능은 최근 몇 년 사이 눈부신 발전을 이루었다. 덕분에 현재 3D 인공지능은 자율주행, HD 맵 제작, 로봇 주행, 3D 스캐닝, 3D 컨텐츠 개발 등 다양한 산업에서 유용하게 사용되고 있다.

 

앞으로는 각 산업의 시장성과 기술 발전 및 문제 해결에 3D 인공지능이 큰 기여를 할 것으로 기대된다. 하지만, 3D 인공지능을 다루는 각 산업의 발전 속도는 기대에 비해 여전히 더딘 상황이다. 3D 데이터에 대한 진입 장벽이 다른 데이터에 비해 매우 높기 때문이다.

3D Cuboid 화면
3D Cuboid 화면

상당히 고가인 수집 장비, 3D 데이터 포멧 및 표준화 문제, 다루기 어려운 응용 소프트웨어 문제 등이 여전히 남아 있다. 이는 인공지능 학습을 위한 데이터셋 구축 역시 마찬가지이다. 앞서 언급한 문제들에 더해 유용하지 못한 데이터셋 가공 도구 문제, 데이터 가공 난이도 문제, 인공지능 모델의 높은 학습 난이도 문제 등이 추가로 존재한다. 이로 인해 3D 데이터셋 구축 속도 및 이를 활용한 인공지능 모델의 개발 속도 역시 더딘 상황이다.

 

그래서 현재의 Point Cloud 데이터는 적절한 표준화와 가이드 제공을 통해 높은 진입장벽 문제를 해소하고, 3D 데이터 가공 및 인공지능 모델 학습에 있어 기업과 대중들이 이해하기 쉽게 정보를 제공할 필요가 있다.

 

Point Cloud 데이터 수집 현재

Point Cloud 데이터의 수집 및 가공 형태와 인공지능 모델은 아직 그 표준이 잘 다듬어지지 않아서 데이터의 파일 저장 형식 및 응용 소프트웨어들이 통일성 없고 호환되지 않는 모습들을 보여준다. 그렇기 때문에 Point Cloud 데이터 및 이들과 함께 수집하는 정보들을 잘 파악하고 이들이 어떻게 사용되는지 파악하는 노력이 어느 정도 필요하다.

 

점 속성 정보

3D Cuboid
3D Cuboid

수집한 데이터의 각 점은 공간 상의 위치 정보(x, y, z)와 속성 정보를 담고 있다. 이때 수집하는 속성 정보는 센서마다 상이한데, 대표적으로 RGB-D 카메라에서 수집하는 점의 색상 정보(R, G, B) 라이다를 통해 수집하는 반사 강도(Reflectance Intensity) 등이 있다. 3D 데이터를 학습하는 딥러닝 모델들은 대부분 이 속성 정보를 같이 학습하므로 모두 수집해 주어야 한다.

 

Visualization

3D Cuboid
3D Cuboid

수집한 데이터를 3차원 공간에 시각적으로 표현하는 것이 가능하지만, 그것만으로는 데이터 내의 Point들이 가진 객체 속성을 직관적으로 알아내는 것이 어렵다. 인공지능 학습을 위해서는 가공자의 라벨링(Labeling) 작업이 반드시 필요한데, 점들만 보고는 그것이 무엇인지 알기 어렵다. 그렇기 때문에 Point Cloud 데이터를 수집할 때는 카메라를 동원해서 이미지를 같이 수집해 객체 속성을 시각적으로 확인할 수 있어야 한다.

 

센서 동기화

센스 동기화 작업
센스 동기화 작업

Point Cloud 데이터 기반 인공지능 모델 학습을 위해서는 앞서 설명한 시각화 문제로 인해 수집 장비가 최소 2개 이상이 필요하다. 그렇기 때문에 수집하는 장비들 간에 동기화 작업이 반드시 필요하다. 동기화는 센서들의 수집 시간을 일치시켜 주는 시간 동기화 작업과 다른 하나는 센서들의 서로 다른 좌표를 일치시켜 주는 공간 동기화 작업이 있다.

  • 시간 동기화의 경우 센서들의 시간이 동기화가 된 상태에서 데이터를 수집해주어야 한다.
  • 공간 동기화의 경우 공간 동기화가 진행된 데이터를 수집하거나 수집 장비 간의 공간 동기화 작업을 위한 좌표 변환 정보를 같이 저장해 준다.

Point Cloud 데이터 가공

인공지능 데이터셋 구축 전문 기업들이 가장 고민하고 있는 부분이 Point Cloud 데이터에 대한 가공 방법이다. 여러 기업이 Point Cloud 데이터 특성 파악과 Point Cloud 데이터를 활용한 인공지능 모델에 대한 분석이 완료된 상황에서 학습 데이터셋 구축과 가공을 어떻게 수행할지 전략을 수립하고 있다. 현재 Point Cloud 데이터셋 가공 도구와 관련해서 활용 중인 가공 작업은 다음과 같다.

Point Cloud Segmentation

Point Cloud Segmentation
Point Cloud Segmentation

Point Cloud Segmentation 모델은 Point Cloud 데이터 내에 있는 모든 점들에 대한 레이블 정보를 각각 정의한다. Segmentation 학습을 위한 데이터 가공 시 점들의 수가 상당히 많기 때문에 데이터의 시각화가 반드시 필요하고, 도구 활용을 통해 효과적인 방법으로 각 점들에게 레이블 속성을 부여할 수 있어야 한다.

 

Cuboid

3D Cuboid
3D Cuboid

3D Object Detection 모델은 객체의 속성을 직육면체 형태의 3D Bounding Box를 통해 정의한다. 이 3D Bounding Box를 Cuboid라고도 한다. Cuboid 정보는 일반적으로 Cuboid의 위치(Position), 크기(Scale), 회전 정보(Rotation)만을 통해 표현하는 ‘PSR(Position Scale Rotation)’ 방식으로 정의한다. 따라서 3D Object Detection 모델의 학습을 위한 데이터셋 가공 역시 PSR 방식으로 레이블 데이터를 생성하는 것이 효과적이다.

 

3DCuboid 교육영상

아래는 3DCuboid 교육영상 입니다. 이미지를 클릭하면 유튜브를 통해 교육 영상을 보실수 있습니다.

큐보이드 교육영상 바로가기
큐보이드 교육영상 바로가기

정리

3D 데이터를 활용한 인공지능은 고가의 데이터 수집 장비, 데이터셋 가공 도구를 포함한 응용 소프트웨어, 표준화 이슈 등의 진입장벽으로 인해 개발에 어려움을 겪고 있다. 이에 2019년 테슬라 CEO 일론 머스크는 라이다에 대해 혹평을 쏟아내기도 했다. 하지만 최근 Point Cloud 데이터의 한계를 극복하는 인공지능 모델이 개발되면서, 자율주행, HD 맵 제작, 로봇 주행, 3D 스캐닝, 3D 콘텐츠 개발 등 다양한 산업에서 3D 데이터를 활용한 인공지능 개발에 대한 시도가 꾸준히 늘고 있다. 

 

 

 

새로운 게임 체인저, 텍스트 생성 AI와 그 파급력

몇 달 전 MS가 ChatGPT의 OpenAI사에 100억 달러 투자를 결정하고 자사 포털 사이트 Bing에 ChatGPT 탑재를 결정하면서 두 빅테크의 동맹이 현실화되었습니다. 이에 뒤질세라 Google에서는 서둘러 자사의

trajectory.tistory.com

 

반응형

댓글