엔씨소프트, 한국어 특화 VLM '바르코 비전' 공개

입력 2024-12-04 17:50
엔씨소프트, 한국어 특화 VLM '바르코 비전' 공개

한국어 멀티모달 벤치마크 5종도 함께 선보여



(서울=연합뉴스) 김주환 기자 = 엔씨소프트[036570]는 한국어 처리에 특화된 중소형 오픈소스 시각언어모델(VLM) '바르코 비전'(VARCO-VISION)을 공개했다고 4일 밝혔다.

VLM은 자연어와 이미지를 함께 활용해 입력값을 넣을 수 있는 언어모델로, 영어·중국어가 대다수인 오픈소스 VLM과 달리 한국어를 지원하는 것이 특징이다.

엔씨소프트에 따르면 '바르코 비전'은 한국어 부문에서 동종 크기 모델 중 1위의 성능을 보이며, 이미지 설명·글자 인식(OCR)·사물 위치 검출 등 기능을 활용한 멀티모달 AI 서비스에 활용할 수 있다.

엔씨소프트는 이날 한국어 인공지능(AI) 모델 연구·발전에 기여하기 위한 벤치마크 5종도 함께 공개했다.



벤치마크는 언어모델의 작업 수행 성능을 평가하는 체계로, 엔씨소프트는 영미권에서 대표적으로 활용되는 객관식·주관식 벤치마크 4종을 기반으로 새로운 한국어 벤치마크 4종을 구축했다.

또 한국어 문서와 표, 차트에 대한 이해 능력을 검증할 수 있는 'K-DTCBench' 벤치마크 1종도 새롭게 추가했다.

이연수 엔씨소프트 리서치본부장은 "앞으로 VLM의 접목 분야를 오디오, 비디오까지 확대하고 콘텐츠 제작 지원 기능을 강화하는 등 다양한 산업에서 활용할 수 있도록 성능을 끌어 올릴 것"이라고 말했다.

jujuk@yna.co.kr

(끝)

<저작권자(c) 연합뉴스, 무단 전재-재배포, AI 학습 및 활용 금지>