네이버가 전화통화, 회의 등의 음성 파일을 손쉽게 문자로 바꿀 수 있는 인공지능(AI) 서비스를 13일 선보였다.
이날 클로바 홈페이지(사진)를 통해 공개된 이 기술은 네이버 음성인식 기술인 ‘NEST(Neural End-to-end Speech Transcriber)’를 기반으로 개발됐다. AI가 음성을 인식해 자막으로 전환해주는 기술이다. 음성인식을 위한 AI 학습에 필요한 데이터 양과 시간을 기존과 비교해 10분의 1가량으로 줄이는 등 효율성을 높였다. 지난 1월부터 네이버 동영상 뉴스 등 일부 서비스에서 도입됐으며 이번에 일반 사용자에게 무료로 공개됐다.
사용자들은 홈페이지에서 뉴스, 전화통화, 오디오클립 등의 음성파일 샘플을 문자로 바꾸는 기능을 체험할 수 있다. 기업 및 단체는 네이버와 제휴해 이를 사용할 수 있다. 현재는 한국어 기반으로 작동한다. 네이버는 하반기 일본어를 시작으로 영어, 중국어 등 적용 언어를 확대해나갈 계획이다.
네이버는 NEST 기술을 적용한 자동 자막을 다양한 동영상 및 오디오 서비스로 확대하고, 동영상 검색에도 해당 기술을 활용할 계획이다. 한익상 네이버 클로바스피치 리더는 “NEST는 동영상 및 오디오 콘텐츠의 자막 제작과 아카이빙 등 다양한 분야에서 활용 가치가 높을 것”이라고 말했다.
구민기 기자 kook@hankyung.com