메트릭스 컨소시엄, '표·차트 이미지 해석 AI 학습용데이터' 구축

입력 2023-09-22 10:20


㈜메트릭스(대표 나윤정)는 과학기술정보통신부가 주관하고, 한국지능정보사회진흥원(NIA)이 추진하는 ''2023년 인공지능 학습용 데이터 구축'의 '표/차트 이미지 해석 데이터' 구축 사업의 주관기관으로 선정되어 사업 수행 중이다.

AI 학습용 데이터 구축 사업은 과학기술정보통신부 디지털뉴딜 실행계획 데이터 댐 사업의 일환으로 인공지능 산업 육성에 필요한 대규모 학습용 데이터를 구축하고 개방함으로써, AI기업의 기술 개발과 사업화를 지원하는 사업이다.

'표/차트 이미지 해석 AI 학습용데이터'는 한국지능정보사회진흥원의 이미지 캡션 과제 중 하나로 문서 내 이미지로 된 차트 30만 종, 표 40만 종을 수집하고, 이미지 내 내용정보를 구조화하여, 해당 차트나 표에 대한 설명문 및 요약문을 생성하는 것을 목표로 한다.

본 과제에는 분야별 전문 기술과 역량을 가진 기업이 참여하고 있는데, 차트 이미지 데이터에 대한 수집/정제/가공은 ㈜메트릭스와 ㈜더바이럴, 표 이미지에 대한 수집/정제/가공은 ㈜스위트케이, 기획 및 검수는 ㈜서홍테크와 ㈜한알음정보가 맡고 있으며, 모델링은 ㈜브레인벤쳐스와 건국대학교산학협력단, 품질검수는 ㈜브레인벤쳐스가 담당한다. 또한, 수요기관으로 참여한 한국조사협회는 국내 50여개의 리서치회사를 회원사로 보유하고 있어 향후 설명문 생성 AI 서비스 개발 시 활용성을 제고할 수 있다.

주관사인 ㈜메트릭스(대표 나윤정)는 통계 및 빅데이터 분석 등을 전문으로 하는 기업으로, 2020년부터 인공지능 학습용 데이터 구축 사업에 꾸준히 참여하여 음성, 텍스트, 이미지, 영상 등 다양한 형태의 AI 학습용 데이터 사업을 수행한 바 있다.

메트릭스의 나윤정 대표는 "오랜 리서치 경험을 충분히 반영할 수 있는 본 과제를 당사에서 수행하는것에 대해 기쁘다"며, "특히 이번 사업을 통해 차트 이미지에 대한 AI 학습용 데이터가 충분히 구축되어 향후 리서치 업계의 품질 개선 등에 큰 변화를 불러일으켜 줄 것을 기대한다"고 밝혔다.

구축된 데이터는 품질 검증 후 'AI허브'에 공개할 예정이다. 데이터셋과 함께 데이터 구조, 데이터 사용 환경 및 사용 방법 등에 대한 설명도 제공할 예정이다. 데이터셋은 챗봇 연구개발, 인공지능 분야 학술연구를 위한 기초 자료로도 활용된다.