김태수 네오사피엔스 대표 "AI가 기쁨·슬픔까지 담은 목소리 만들어내죠" [긱스]

입력 2023-09-13 17:52
수정 2023-09-14 01:47

“이제 인공지능(AI)으로 자기 목소리도 쉽게 만들 수 있습니다. 내 목소리를 파는 시대도 올 겁니다.”

‘AI 성우’ 서비스 타입캐스트를 개발한 네오사피엔스의 김태수 대표는 13일 한국경제신문과의 인터뷰에서 “AI 챗봇 ‘챗GPT’의 영향으로 타입캐스트를 찾는 이용자가 급증해 AI 성우 서비스의 성능을 개선하고 종류도 확대하고 있다”며 이같이 설명했다. 네오사피엔스는 국내 대표적인 AI 기반 음성 생성 스타트업이다. 퀄컴, KAIST 등 출신의 관련 연구진이 2017년 창업했다. 김 대표는 LG전자에서 여러 사람의 목소리를 분리하는 기술을 개발했고, 퀄컴의 핵심 기술인 ‘스냅드래곤 보이스액티베이션’을 만들었다.

네오사피엔스의 경쟁력은 사람 목소리와 구분하기 힘든 음성 콘텐츠다. 전화 자동응답시스템(ARS)에서 들을 수 있는 어색한 기계음과 달리 사람이 실제 말하는 듯한 착각을 일으킬 정도다. 슬픔, 기쁨, 분노 등 다양한 감정 표현도 자유자재로 가능하다. 한국어, 영어, 일본어, 독일어, 프랑스어, 스페인어, 프랑스어 등을 구사할 수 있는 AI 성우를 490개 제공하고 있다. 올해 안에는 중국어와 포르투갈어 ‘목소리 배우’도 출시할 계획이다.

유튜브 등 음성이 필요한 콘텐츠가 급증하면서 네오사피엔스도 급격히 성장하고 있다. 2019년에 나온 타입캐스트의 누적 가입자 수는 최근 155만 명을 넘어섰다. 유료 이용자는 지난 3년 동안 18배 급증했다. 68개국에서 돈을 내고 타입캐스트를 사용하고 있다. 지난해 국내 유튜브 쇼츠(짧은 영상) 부문에서 최다 시청자를 기록한 유튜브 채널 ‘1분요리 뚝딱이형’에 나오는 목소리를 타입캐스트에서 만들었다.

김 대표는 올해 네오사피엔스를 찾는 이용자가 급증했다고 설명했다. 작년 말 챗GPT가 나오면서다. 그는 “타입캐스트를 쓰려면 대본이나 텍스트가 있어야 하는데 챗GPT가 관련 콘텐츠 생산량을 수십 배 늘렸다”고 설명했다. 타입캐스트의 해외 이용자 비중이 70%까지 올라가기도 했다.

네오사피엔스는 올해 미국 시장을 본격적으로 공략할 계획이다. 세계적으로 급증한 AI 성우 서비스의 수요를 노리기 위해서다. 김 대표는 “새로 창업한다는 생각으로 미국 실리콘밸리에서 홀로 미국 문화를 경험하면서 서비스를 개선할 계획”이라고 말했다.

AI 관련 저작권 문제에 대해선 “네오사피엔스는 콘텐츠 개발에 도움을 준 성우에게 보상하고 있다”며 “저작권은 반드시 보호해야 하지만 AI가 충분히 데이터를 학습할 수 있는 환경을 조성하는 것도 필요하다”고 했다. 화가가 존경하는 예술가의 그림을 보고 공부하면서 결과물을 내놓듯이 AI도 제 성능을 내기 위해선 기존 성과물을 학습할 수밖에 없다는 설명이다. 김 대표는 “저작권을 무시하지 않으면서도 기존 콘텐츠를 AI가 학습할 수 있는 제도가 필요하다”고 강조했다.

그는 “머지않은 미래엔 우리가 TV 등 여러 매체를 통해 접하는 사람 모습의 절반 이상은 진짜 사람이 아닐 정도로 AI 서비스가 보편화될 것”이라고 전망했다.

김주완 기자 kjwan@hankyung.com