네이버는 신규 모델의 파라미터를 대폭 줄였지만 성능은 개선됐다고 밝혔다. AI 지능을 측정하는 벤치마크인 ‘다중과제 언어이해 평가’(MMLU)에서 신형 하이퍼클로바X의 정답률은 79.6%에 달했다. 이전 모델 정답률(68.0%)을 넘어섰다. MMLU는 과학, 수학, 사회과학 등 57개의 과목을 망라해 AI 성능을 측정하는 지표다.
글로벌 빅테크의 AI와 맞먹는 성능이라는 평가가 나온다. 네이버의 신형 AI는 300억~400억 개의 파라미터로 구축한 것으로 추산된다. 비슷한 크기인 알리바바 ‘큐원2.5’의 정답률은 75.2%다. 애플의 경량화 AI 모델도 63.7%의 성적을 냈다. 프랑스 미스트랄AI의 ‘미스트랄 스몰3’는 81%를 기록했다. 경량급 AI 모델 중에선 네이버가 상위권을 차지한 것이다.
네이버는 이번 AI 모델에 ‘멀티 모달리티’ 기능을 고도화했다. 텍스트와 이미지를 넘어 동영상과 차트, 도표 등 모든 형태의 시각 데이터를 처리하는 기능을 개선했다. 네이버 관계자는 “신형 모델의 운영 비용은 이전 모델에 비해 50% 줄었다”고 말했다. 네이버는 AI 모델 업그레이드와 함께 네이버 모든 서비스에 AI를 도입하는 전략을 구체화하고 있다.
오현우 기자 ohw@hankyung.com