[일상] 문자 인식하기

출력된 문서, 사진 혹은 필기한 문서를 인식하는 기술을 OCR이라고 합니다.
OCR(Optical character recognition) 광학 문자 인식 기술로 아주 오래전 부터 연구하였던 분야입니다. 이 분야도 딥러닝 기술이 도입되면 획기적으로 발전을 하였네요.

이제는 왠만한 글자는 모두 인식합니다.

대표적인 예로 명함에 있는 내용을 인식한 CamCard에 이 기술이 사용되고 있습니다. 요즘 금융권에서 비대면 계좌를 열때도 신분증을 스캔하면 OCR 기술을 이용하여 개인 정보가 자동으로 text로 변경됩니다.

주민증, 운전면허증과 같이 정형화된 문서인 경우에는 인식률은 거의 100% 까지 나옵니다.

문제는 비정형 문서인데요. 글자가 위아래로 써진 경우도 있고, 다양한 폰트를 적용하여 인식하기 어려운 경우도 많이 있습니다.

Naver 클로버 팀에서는 일찌기 OCR 쪽을 전략 분야로 선정하고 딥러닝을 이용한 기술 발전에 매진을 해왔는데요. 그 결과 OCR 기술을 일반 기업에서도 사용할 수 있도록 API를 공개했습니다.

https://clova.ai/ocr

google에서도 OCR 기술을 제공하지만 한글에 대해서는 naver가 우위를 점하고 있다고 합니다.

그런데 ocr 기술의 숨은 강자가 있더군요.

회사이름은 로민.

기사를 보니 다양한 문서를 스캔하여 text로 변경하고자하는 업계 수요가 많다고 합니다.

보험사와 금융권을 중심으로 파악되던 비정형문서 이미지에 대한 문자인식(OCR) 수요가 카드사와 자동차 부문까지 확장되고 있다고 하는군요.

아마도 고객이 뭔가를 신청하기 위하여 서류 작성하고 관련 서류를 제출하는 모든 분야에서 필요한 기술로 보입니다.
의외로 기술력 좋은 스타트업들이 많습니다.

자세한 사항은 아래 기술 참고.
http://www.aitimes.kr/news/articleView.html?idxno=17073

Coin Marketplace

STEEM 0.19
TRX 0.15
JST 0.029
BTC 63398.53
ETH 2660.51
USDT 1.00
SBD 2.77