파워젠, AI 기반 ‘Gen OCR 솔루션’ 산업·사무환경에 효율적이고 최적화된 솔루션으로 주목

파워젠 AI 기반 ‘Gen OCR 솔루션’

인공지능(AI) DX 전문 기업(대표 이정규) 파워젠은 자사가 출시한 AI 기반의 Gen OCR 3.0이 실제 산업 현장, 사무 업무에 가장 높은 효율성을 제공하며 고객들에게 호평을 받고 있다고 4일 밝혔다.

지난해 출시한 파워젠의 AI 기반 Gen OCR은 다양한 비정형 이미지 문서에서 필요 정보를 추출해 자동화 업무에 신속하게 대응하기 위한 이미지 정보 추출 솔루션이다. RPA와 컬래버레이션을 가장 잘 이루는 솔루션으로 평가된다.

Gen OCR은 문서 분류 처리 시간 단축을 위해 해당 문서 전체의 분류를 최적화할 수 있는 영역의 최소 부분을 이미지 비교 영역으로 지정하고, 지정된 영역의 대표 문서와 처리 문서의 이미지를 비교해 일정 유사도를 보이면 같은 문서로 OCR 처리한다. 또 안 되는 것은 Not Processed로 재학습 처리하는 등 새로운 방식의 대표 문서 기반 기계 학습 기능을 도입해 다른 제품과 차별화했다.

Gen OCR은 지정된 영역의 특정 String을 Neural String Find 모델을 사용하고 True Keyword, False Keyword를 활용해 문서 분류를 한다(String 비교를 빠르게 하기 위함).

이렇게 하면 사람이 볼 때 유사한 문서가 여러 원인으로 OCR한테 다른 문서로 오인식되는 문제를 최소화해 대그룹 단위로 묶을 수 있고, 적은 문서량으로도 학습 가능해 구현 이후 학습 효율성이 크게 향상된다.

즉 주민등록증, 운전면허증이나 여권이 하나의 신분증 유형으로 통합해 관리할 수 있다.

학습한 문서를 바탕으로 문서 유사도 및 키워드에 따른 자동 문서 분류가 가능해 싱글 필드 단위 및 테이블 형태의 라인별 정보 추출을 모두 할 수 있으며, 판독한 결과는 RPA 처리를 위한 파일 형태와 내재한 API를 통해 다른 시스템과 직접 연계가 가능하다.

또 병렬 처리 미들웨어(Middleware) 엔진을 통해 대용량 문서의 빠른 OCR 처리를 돕고, 자동 학습 라벨 기능으로 사용자의 문서 Training 노력을 최소화할 수 있다. Noise가 있는 문자 이미지 정보에 대해서도 Deep Learning을 통해 정확도를 높일 수 있는 기능이 내재, 필기체 형태의 이름이나 숫자 등을 계속 학습시키면 시킬수록 정확도가 높아지도록 설계됐다.

아울러 GPU 서버 방식의 웹 시스템으로 개발돼 현업 담당자별 사용 결과 접근이나 보안 및 유지 보수가 쉽다.

FAX 등 저품질 문서의 자동 정위치, 찌그러짐 보정, 자동 노이즈 제거를 통한 OCR 엔진의 인식률을 높일 수 있는 자동 전처리 기능과 AI 서류 분류(Documents Classifier) 기능을 탑재해 대량 페이지 문서 가운데 필요·불필요 페이지를 기계 학습을 통해 필요한 페이지에서만 정보를 추출하도록 하는 차별화한 지능을 갖췄다. 이에 전체 문서를 읽어 들이는 기존 OCR의 비효율성을 개선했다.

또 기존 OCR의 Full Text 처리 결과를 기반으로 Text Analysis를 통해 필요한 값만 추출해야 하는 SI성 개발 부담을 크게 줄일 수 있게 됐다.

특히 멀티 OCR 엔진으로 기계적 교차 검증을 할 수 있어 결과 처리에 대한 사람의 눈 검증을 90% 이상 절감할 수 있는 특장점도 있다. 문서 유형 또는 문서 필드별로 값을 잘 읽는 OCR 엔진을 지정할 수 있어 하나의 OCR 엔진에 종속되는 문제도 해결할 수 있다.

최근 제조 업체 A 기업과 금융권 B 기업은 기존 OCR이 인식하지 못하는 고객 특화 문서 및 문서 영역에 대해 파워젠의 Gen OCR이 높은 인식률을 보여주자 “자사의 업무 자동화에 대한 기술적인 고민을 해결해줬다”며 파워젠의 노고에 감사를 나타내기도 했다.

파워젠 이정규 대표이사는 “최근 자사 Gen OCR에 대한 고객들의 신뢰와 응원에 깊은 감사를 드린다"며 “OCR은 제조 현장의 문서, 하드카피나 팩스로 온 문서, 일반 OCR로 인식하기 어려운 상태의 문서, 모바일 카메라로 찍은 문서 등을 정확히 인식해 RPA를 통해 자동 업무 환경을 구축, 기존 OCR 솔루션보다 월등한 업무 효율을 제공해 실제 현장에 맞는 OCR을 구축해 고객의 디지털 전환 구현에 앞장서 나가겠다”고 말했다.

전호종 기자 다른기사 보기