본문 바로가기
데이터라벨링

OCR AI가 글자를 읽는 방법

by 그린망고 2023. 5. 4.
반응형

혹시 OCR이라는 기술을 들어보셨나요? 아파트, 백화점 주차장에 들어가면 자동으로 차량 번호가 인식되고 스마트폰으로 신분증이나 신용카드를 카메라로 인식하면 카드 번호가 저절로 입력되고 이런 것들이 모두 OCR 기술을 활용한 문자 인식이에요.

OCR
OCR 예시

OCR이란?

OCR은 Optical Character Recognition, 즉 광학문자 인식의 약칭인데요. 딥 러닝 기술을 이용해 사람이 손으로 직접 쓴 필기 문자나 폰트 등의 인쇄, 웹용 글자 이미지를 스캔하여 텍스트로 변환하는 소프트웨어를 통틀어 이야기해요. 구글, 네이버, 클라우드 플랫폼뿐만 아니라 눈에 보이지 않는 수많은 분야에 OCR 프로그램이 쓰이고 있죠.

 

예를 한번 들어볼까요?

많은 사람이 사용하는 네이버의 번역 프로그램 파파고, 파파고에서는 글자가 쓰여 있는 이미지 데이터를 글자로 변환하여 번역해 주는 이미지 번역을 서비스하고 있어요. 그리고 이미지 번역 기능은 간판이나 전단지에 인쇄된 글자를 번역해야 할 때 유용한 기능으로 이미 많은 사용자를 보유하고 있죠. 그뿐만 아니라 각종 공공기관 및 은행 애플리케이션에서 본인 확인 절차에 OCR을 활용하기도 하는데요. 생소한 개념이라고 생각했지만, 생각보다 많은 곳에서 OCR 기술을 이용하고 있는 것 같죠.

 

OCR의 발전

OCR은 인공지능이나 비전의 연구 분야로 시작됐어요. 수동으로 텍스트를 입력할 필요 없이 컴퓨터가 읽을 수 있고 컴퓨터로 편집할 수 있는 디지털 문서를 만드는 것은 모두가 필요로 했던 기능이었죠. 기존 폰트와 문서 이미지를 비교하여 이미지를 인식했던 초기 OCR 시스템은 특정한 서체를 읽기 위해 미리 해당 서체의 샘플을 읽는 트레이닝이 필요했어요. 기술의 부재로 인해 이미지 속 문자만 인식했던 거죠. 현재 OCR 기술은 그보다 훨씬 발전해서 딥러닝으로 문장의 앞뒤를 파악해 단어를 추측하는 단계까지 발전했기 때문에 전처럼 많은 트레이닝이 필요하지 않아요. 이에 따라 폰트의 제약이 훨씬 줄어들었고 사진뿐만 아니라 움직이는 영상 속 문자까지 인식할 수 있게 되었어요.

 

OCR의 처리 단계

  1. 이미지 입력 - 스마트폰으로 촬영한 저화질 문서를 입력
  2. 문서 보정 - 입력된 이미지를 프로세싱하여 자동으로 전처리
  3. 문서 OCR - 전체 이미지에서 텍스트 영역을 골라내고 문자들을 하나의 문자로 각각 인식 후 딥러닝 시스템으로 의미를 파악, 이 부분에서 데이터 라벨링이 필요
  4. 후처리 - 출력된 텍스트의 내용적인 부분을 따져서 부자연스러운 단어나 문자가 포함되면 이를 수정하면서 정확도를 보다 향상

OCR의 활용

앞에서 말씀드렸듯 OCR을 활용하고 있는 곳은 무궁무진해요. 시각 장애가 있는 유저가 글자를 이해하는 데 도움을 주기도 하고, 대량의 문서를 텍스트 파일로 바꿔야 하거나 사람이 직접 글자를 읽어야만 했던 업무에 대체 투입되어 불필요한 이익 손실을 줄이고 있죠. 공항 셀프 체크인 키오스크를 보신 적이 있나요? 이런 키오스크에서 여권을 인식할 때도 OCR 기술이 활용되는데요. 사람이 여권을 확인하는 것보다 빠르고 간편하게 체크인을 끝낼 수 있어요. 그리고 각종 애플리케이션에 흔하게 쓰이는 신분증 검사기 또한 OCR을 사용하는 대표적인 경우에요. 복잡한 신분 인식 방법 대신 OCR 인식을 사용함으로써 훨씬 더 빠르게 신분증을 검사할 수 있죠. 서류로 되어 있는 문서들에 OCR 기술을 활용하면 컴퓨터로 편집할 수 있는 디지털 파일로 변환되어 서류의 종류와 목적에 따라 효율적으로 관리할 수 있기도 해요. 그 밖에도 명함관리, 시각장애인 음성 지원, 차량번호 자동 인식, 핀테크 같은 곳에도 OCR이 활용되고 있습니다.

 

지금까지 데이터 라벨링에서 OCR이 무엇인지 어디에 활용하는 기술인지 알아보았는데요. 생소한 이름과 달리 생각보다 많은 곳에서 OCR 기술을 사용하고 있어요. 막연히 편리하다고 여겼던 인공지능 기술, 이름부터 활용법까지 알게 되면 더 알차게 이용할 수 있겠죠. 멀어 보였던 인공지능 사실은 아주 가까운 곳에서 항상 우리를 도와주고 있었네요.

 

 

 

 

인공지능 학습 데이터 전문 자격증, AIDE 자격증

데이터 라벨링이란 특정 데이터를 인공지능이 학습할 수 있도록 데이터를 가공하는 기술을 말합니다. 예를 들어 이미지 속 나무가 소나무인지 은행나무인지 구별하는 것, 즉 라벨링 하는 것입

trajectory.tistory.com

 

728x90
반응형

댓글