메뉴 닫기

AI기반에서 개발된 이미지 속 문자추출 모듈 ImageOCR



OCR
은 “Optical Character Recognition(광학적 문자인식)”으로 문서나 이미지의 텍스트를 디지털 데이터로 변환해주는 기술입니다.
언택트 시대에 은행을 방문하지 않고 집안에서 신분증을 스마트폰으로 촬영하여 신분확인 후 카드발급신청을 한다거나,
은행 어플을 통한 지로납부 시에도 OCR 기능이 사용되며, 이외에도 신용카드 인식, 여권 인식 등 널리 사용중에 있습니다.

ImageOCR
은 다양한 유형의 문서, 이미지(JPG, PNG, GIF, Tiff, BMP, PDF)에 포함된 문자를 일반 텍스트 문자로 변환해주는 솔루션입니다.


특징

  • 정확한 문자 인식

OCR(Optical Character Recognition : 광학문자인식)은 이미지내의 문자를 자동으로 이식하는 기술입니다.

다양한 문자를 인식하기 위해 독자적인 AI기반 OCR엔진을 개발하여 문자 영역 검출 및 인식 기술을 보유하고 있습니다.

또한 손쉽게 템플릿을 만들고 원하는 영역을 지정한 뒤, 필요한 문자만 빠르게 추출하는 기능을 제공합니다.

  • 다양한 문서 및 이미지에 대한 문자 인식

다양한 이미지 파일 뿐만 아니라 오피스, 아래한글 등에 포함되어 있는 이미지들에 대한 인식 처리가 가능합니다.

 

 

 

이미지에서 문자를 추출하는 원리

 

OCR 전처리 과정
OCR 전처리 과정

 

적용분야

DocuOCR

  • 이미지에서 문자를 추출하여 수작업으로 분류하던 문서들을 등록된 템플릿의 형태에 따라 자동화 프로세스에 적용, 사용자의 개입없이 문서 분류가 가능하여 효과적인 업무 워크플로우 설계가 가능합니다.

 ImageOCR & OCR Filtering 

  • 홈페이지 게시물의 업로드, 다운로드시 텍스트 및 이미지 문서내의 개인정보를 탐지, 차단을 홈페이지 서버의 성능저하 없이 실시간으로 지원합니다.

ImageScanner

  • WEB, WAS 서버내의 개인정보나 중요정보가 포함된 문서를 찾기 위한 기능으로 문서내의 텍스트와 이미지속의 개인정보나 중요정보를 찾을 수 있습니다.

ImageMasking

  • ImageScanner에서 탐지된 이미지파일이나 PDF파일 속의 개인정보나 중요정보에 대해 마스킹 처리가 가능합니다.

OCR Mail Filter

  • 메일 시스템과 연동하여 개인정보의 탐지 및 대외비의 유출 탐지가 가능합니다.