"20분 녹음으로 목소리 합성"…SK C&C, AI 음성변환 기술 상용화
스타트업 '라이언로켓'과 MOU…한국어 음성으로 중국어·영어 합성 기능도 개발
(서울=연합뉴스) 홍지인 기자 = 20분 정도의 녹음 자료만 있으면 말한 사람의 목소리를 비슷하게 합성해 내는 인공지능(AI) 기술이 상용화됐다.
SK㈜ C&C는 23일 음성합성 스타트업 라이언로켓과 '인공지능 텍스트 음성 변환(TTS) 사업 협력 협약(MOU)'을 체결했다고 밝혔다.
양사가 힘을 합친 'AI 텍스트 음성 변환' 기술은 20분 분량의 녹음 데이터로 말하는 사람의 목소리·톤·억양·발음·속도 등 특징을 분석해 어떤 문장이라도 자연스럽게 읽어 내려간다고 SK C&C는 소개했다.
음성을 자음·모음으로 나눠 소리를 붙이는 기존 텍스트 음성 변환 기술과 달리 AI가 제공자의 말뭉치를 그대로 분석·학습하는 기술을 적용했다.
이전까지 오디오북 한 권 만드는 데 한 달 넘게 걸렸지만, 이 기술을 적용하면 이미 녹음 파일을 보유한 한류 스타나 유명 캐릭터는 별도 녹음 없이 문자 입력과 동시에 목소리를 생성해 제작 기간을 크게 줄일 수 있다고 회사 측은 설명했다.
양측은 이 기술로 문화·교육 분야를 비롯한 국내외 콘텐츠 시장을 공동 발굴할 계획이다.
먼저 문화재청 국립문화재연구소와 함께 시각장애인을 위한 천연기념물 소개용 점자감각책에 들어가는 이야기 해설 제작을 지원했다. 시각장애인을 위한 목소리 기부 의사를 밝힌 배우 이병헌과 한지민의 목소리를 재현했다.
또 한류 스타 및 캐릭터를 활용한 글로벌 콘텐츠 사업 및 일반인 및 아동 대상 도서 읽어 주기 등 사업도 개발할 계획이다.
라이언로켓 정승환 대표는 "한국어 음성 데이터만으로 중국어·영어 등 외국어를 자동 생성하는 기능도 개발해 글로벌 시장 진출을 적극적으로 추진할 것"이라고 말했다.
SK C&C 이석진 그룹장은 "이번 협력으로 시각장애인 교육 및 문화생활 향상에 기여할 수 있는 다양한 사회적 가치 실천 프로그램을 만들어가는 데 노력하겠다"고 말했다.
ljungberg@yna.co.kr
(끝)
<저작권자(c) 연합뉴스, 무단 전재-재배포 금지>