로민, AI 기반 고성능 문서 데이터 처리 솔루션 ‘텍스트스코프 Doc 파서’ 선봬

입력 2024-04-16 13:27
수정 2024-04-16 13:43
AI OCR 기반 이미지 파일 파싱·LLM/RAG 서비스 연계 지원


도큐먼트AI 전문기업 로민(대표 강지홍)은 AI 기반 고성능 문서 데이터 처리 솔루션 ‘텍스트스코프 Doc 파서(Textscope® Doc Parser)’를 출시했다고 16일 밝혔다.

로민은 LLM/RAG(검색증강생성) 시대 도래로 기업과 공공기관의 문서 지식 정보 활용에 대한 요구가 커짐에 따라 텍스트스코프 Doc 파서를 출시하게 됐다고 설명했다.

텍스트스코프 Doc 파서는 다양한 형식의 문서에서 글자, 그림, 표 등을 추출하고 읽기 쉬운 포맷으로 변환하여 LLM 기반 비즈니스 애플리케이션 활용을 지원하는 문서 데이터 처리 솔루션이다.

이 제품은 강력한 문서 파싱 기능으로 ▲10종 이상의 레이아웃 요소 인식 ▲자연스러운 읽기 순서 유지 ▲폰트 크기·이미지 크기 및 위치 인식 ▲그림/표 캡션 관계 인식이 가능하다.

또한, AI OCR 기반 이미지 파일 인식 기능으로 저화질 이미지, 복잡한 표구조, 필기체 등 서식의 다양성과 변동성에 관계없이 정확하게 데이터를 인식하고 추출하며 다양한 입/출력 파일 포맷을 지원한다.

더불어 LLM/RAG 연계 지원이 가능히다. RAG의 필수 요소인 벡터 임베딩(Vector Embedding)위한 데이터 연계 기능 및 LLM 성능 개선을 위한 프롬프트 맞춤형 데이터 형식을 제공한다.

로민 강지홍 대표는 “로민의 도큐먼트 AI 기술력을 활용한 이 제품은 원본 문서를 기업에서 활용할 수 있는 가장 최상의 상태로 변환해 주는 솔루션”이라며 “고객이 정확한 데이터 분석을 통해 더욱 현명한 의사결정을 내리는 데 도움이 될 것으로 기대한다”고 말했다.