ETRI, 4개국어 언어음성DB '값싸게 공급한다'(종합)

입력 2016-03-30 16:54
<<제목 및 부제 수정. 언어음성DB에 대한 설명 보충.>>독일·러시아·아랍·베트남어 음성DB 산업체·학계에 배포



한국전자통신연구원(ETRI)은 독일어·러시아어·아랍어·베트남어의 대화체 문장과 각 외국어의 한국어 대역 문장을 녹음한 언어음성 데이터베이스(DB)를 구축, 음성인식 소프트웨어(SW) 등 개발에 활용하도록 저렴하게 배포한다고 30일 밝혔다.



언어음성 DB에는 4개국어 대화체 문장 약 36만개와 한 외국어 당 한국어 대역문장 5만 개씩 모두 20만 문장이 담겨 있다.



언어음성 DB는 음성인식·언어번역 분야의 소프트웨어(SW) 개발이나 음성언어처리 연구에 기초데이터로 사용된다. 음성언어 SW는 태블릿 PC나 내비게이션, 스마트폰, 전자사전, 지능형로봇 분야 등에 활용되고 있다.



ETRI는 이번에 배포하는 다국어 음성DB가 앞으로 이들 언어권에 수출되는 에어컨, TV 리모컨, 내비게이션 등 전자제품에 음성인식 SW를 장착하는 데 활용돼 수출에 기여할 것으로 보고 있다.



또 국내 업체와 애플, 구글 등 세계적 기업 사이에 경쟁이 벌어지고 있는 인공지능, 사물인터넷(IoT), 지능형 로봇, 자율주행 자동차, 스마트TV 등의 스마트 인터페이스 분야에서도 국내 기업의 기술 경쟁력을 강화하는 데 기여할 것으로 연구진은기대하고 있다.



음성DB를 이용한 제품은 국내 DB가 없을 경우 외국에서 개발된 음성인식 및 번역 엔진을 도입해 탑재해야 하기 때문에 큰 비용이 든다.



유럽언어자원협회(ELRA) 등 해외에서 살 수 있는 일부 외국어 DB는 300∼500명이 참여한 제품의 경우 1억∼2억원 정도가 필요하다. 하지만 2천400여명이 참여한 ETRI의 4개국어 음성DB는 해외DB의 5∼10% 수준 가격으로 중소기업에 제공된다.



ETRI는 2011년부터 한·영·일·중 등 다국어 언어음성DB를 구축하고 57개 기관에 배포, 430억원 상당의 비용 절감 성과를 거뒀다며 이번에 배포하는 4개 국어 언어음성 DB를 10개 기관에 배포하면 최소 120억원의 수입대체효과를 얻을 수 있을 것이라고 밝혔다.



ETRI 자동통역연구실 이영직 박사는 "ETRI 음성DB는 국가DB사업에서 요구하는고품질 수준으로 국가지정 감리업체의 검사에서 합격했다"며 "이 DB를 활용하면 언어음성기술의 완성도를 높일 수 있어 신규시장 창출과 국제경쟁력 강화에도 도움이될 것"이라고 말했다.



scitech@yna.co.kr(끝)<저 작 권 자(c)연 합 뉴 스. 무 단 전 재-재 배 포 금 지.>