다음커뮤니케이션이 모바일 음성 인식 API(응용프로그램환경)을 공개한다고 오늘(3일) 밝혔습니다.
음성 인식 API는 스마트폰이 인식한 한국어 음성을 자동으로 텍스트로 변환하는 기능입니다.
다음의 음성 인식 API는 2012년말 다음이 인수한 음성인식 전문기업 '다이알로이드'의 기술로 만들어졌습니다.
공개되는 음성 인식 API는 크게 네가지 종류의 음성 인식 기능이 있습니다.
단어 기반의 웹 검색을 위한 ‘키워드형’과 지도상의 위치 설명 문장을 더 빠르게 인식하는 ‘지도형’이 있습니다.
여기에 일반적인 문장과 대화에 유리한 ‘연속형’과 단어 집합(set) 단위로 음성 인식을 수행하는 ‘단어인식형’도 갖추고 있습니다.
사용자는 이들 기능 중 원하는 기능을 선택해서 음성 인식을 수행할 수 있습니다.
이 기술은 현재 KT의 음성인식 큐레이션 서비스인 '매직보이스'와 다음앱에서 음성으로 간편하게 뉴스 댓글을 남길 수 있는 '음성댓글' 서비스에 적용 중 입니다.
특히 안드로이드와 iOS용 SDK(Software Development Kit : 소프트웨어 개발 키트)를 제공해 안드로이드와 아이폰 앱 개발자 모두 사용할 수 있습니다.
iOS용 한국어 음성 인식 SDK는 현재 구글에서 제공하고 있지 않습니다.
이상호 다음 검색 부문 부사장은 "이번 공개로 인해 많은 모바일 앱 개발자들이 다음이 제공하는 음성 인식 기능을 이용하여 더욱 가치있는 모바일 서비스를 제공할 수 있을 것으로 기대된다"며 "앞으로 다음 검색 등 부가 서비스와 연계한 기능을 지속적으로 추가해 나갈 것"이라고 밝혔습니다.