파워젠, AI 기반 ‘Gen OCR 솔루션’이 산업 현장 고객에게 호평 받아
  • 2022-03-07
  • 신윤오 기자, yoshin@elec4.co.kr

인공지능(AI) DX 전문 기업(대표 이정규) 파워젠은 자사가 출시한 AI 기반의 Gen OCR 3.0이 실제 산업 현장, 사무 업무에 가장 높은 효율성을 제공하며 고객들에게 호평을 받고 있다고 밝혔다.

지난해 출시한 파워젠의 AI 기반 Gen OCR은 다양한 비정형 이미지 문서에서 필요 정보를 추출해 자동화 업무에 신속하게 대응하기 위한 이미지 정보 추출 솔루션이다. RPA와 컬래버레이션을 가장 잘 이루는 솔루션으로 평가된다.




Gen OCR은 문서 분류 처리 시간 단축을 위해 해당 문서 전체의 분류를 최적화할 수 있는 영역의 최소 부분을 이미지 비교 영역으로 지정하고, 지정된 영역의 대표 문서와 처리 문서의 이미지를 비교해 일정 유사도를 보이면 같은 문서로 OCR 처리한다. 또 안 되는 것은 Not Processed로 재학습 처리하는 등 새로운 방식의 대표 문서 기반 기계 학습 기능을 도입해 다른 제품과 차별화했다.

Gen OCR은 지정된 영역의 특정 String을 Neural String Find 모델을 사용하고 True Keyword, False Keyword를 활용해 문서 분류를 한다(String 비교를 빠르게 하기 위함). 이렇게 하면 사람이 볼 때 유사한 문서가 여러 원인으로 OCR한테 다른 문서로 오인식되는 문제를 최소화해 대그룹 단위로 묶을 수 있고, 적은 문서량으로도 학습 가능해 구현 이후 학습 효율성이 크게 향상된다.

특히 주민등록증, 운전면허증이나 여권이 하나의 신분증 유형으로 통합해 관리할 수 있다. 학습한 문서를 바탕으로 문서 유사도 및 키워드에 따른 자동 문서 분류가 가능해 싱글 필드 단위 및 테이블 형태의 라인별 정보 추출을 모두 할 수 있으며, 판독한 결과는 RPA 처리를 위한 파일 형태와 내재한 API를 통해 다른 시스템과 직접 연계가 가능하다.

또 병렬 처리 미들웨어(Middleware) 엔진을 통해 대용량 문서의 빠른 OCR 처리를 돕고, 자동 학습 라벨 기능으로 사용자의 문서 Training 노력을 최소화할 수 있다. Noise가 있는 문자 이미지 정보에 대해서도 Deep Learning을 통해 정확도를 높일 수 있는 기능이 내재, 필기체 형태의 이름이나 숫자 등을 계속 학습시키면 시킬수록 정확도가 높아지도록 설계됐다.

아울러 GPU 서버 방식의 웹 시스템으로 개발돼 현업 담당자별 사용 결과 접근이나 보안 및 유지 보수가 쉽다고 회사 측은 밝혔다. 

<저작권자(c)스마트앤컴퍼니. 무단전재-재배포금지>


#소프트웨어   #인공지능  

  • 100자평 쓰기
  • 로그인

세미나/교육/전시
TOP