카카오엔터프라이즈는 올해 상반기 인공지능(AI) 분야 글로벌 학회에서 논문 17건을 등재했다고 19일 밝혔다.
카카오엔터프라이즈는 자연어 처리와 음성 처리, 컴퓨터 비전 분야를 아우르는 연구 성과를 발표했고, 이번 해에는 새롭게 강화학습, 지식그래프 분야에서도 논문을 발표했다.
먼저 자연어 처리 분야 글로벌 학회인 NAACL에서 기존 사전학습 언어모델을 대화 속 감정을 추출하는 데에 활용하는 방법론을 발표했다.
최근 자연어처리 분야에서는 대화 속 감정을 인식하기 위해 상식이나 감정에 대한 외부지식을 이용한 방식이 활용되고 있다.
하지만 비영어권 언어에서는 영어에 비해 축적된 사전지식이 적기 때문에 이 방식을 그대로 적용하기 어렵다는 문제가 있다.
카카오엔터프라이즈는 이를 해결할 새로운 방법론을 제안하며 한국어에서 외부지식에 의존하지 않고도 감정 인식에서 높은 성능을 낼 수 있음을 증명했다.
음성 처리 분야 세계 최대 규모 학술대회인 인터스피치에서는 총 4편의 연구 성과를 발표했다.
이 중 ‘E2E(End to End)-TTS(종단간 TTS)’ 기법을 응용해 기존 ‘뉴럴 TTS(Text to Speech)’ 개발 과정을 단순화하는 방법이 특히 주목을 받았다.
기존 뉴럴 TTS 방식이 음성 처리를 위해 2개의 모델(acoustic feature generator, neural vocoder)을 따로 학습해야 했다면 E2E-TTS 기법을 활용하면 두 모델을 한번에 학습할 수 있게 되어 학습 과정을 단축하는 것은 물론 실제 사람과 구별하기 어려운 수준의 고품질의 음성을 만들어 낼 수 있다.
글로벌 AI 대회에서도 전 세계가 주목할 성적을 거뒀다. 카카오엔터프라이즈는 지난 6월 전 세계 기술 표준을 선도하는 미국 국립표준기술연구소(NIST)가 주관하는 ‘얼굴 인식 기술 대회’의 1:1 검증 ‘키오스크’ 부문에서 세계 1위를 차지했다.
지난 3월에는 자체 개발한 자연어처리 AI 모델로 한국어 기계독해 데이터셋 ‘코쿼드2.0’ 성능 평가에서 1위를 차지했다.
1위에 오른 ‘리틀버드-라지’ 모델은 정확도 90.22점을 기록했으며 처리 속도 역시 기존 1위 모델 대비 약 1.7배 빨라졌다.
백상엽 카카오엔터프라이즈 대표는 “반도체가 한국의 제조 경쟁력을 견인했던 것처럼 AI가 한국 디지털산업의 씨드(seed) 기술로 자리잡을 수 있도록 많은 투자와 노력을 아끼지 않겠다"면서 “AI 기술력을 더욱 고도화시켜 이를 AI 챗봇, 컨택센터, 더 나아가 스마트시티를 구성하는 실제 서비스로 연결시킴으로써 사용자에게 더 나은 삶을 선사할 수 있는 기술 제공에 집중할 계획"이라고 말했다.