[AI뉴스레터]AI 성우가 감정까지 넣어서 문자를 소리로

입력 2022-04-07 06:30
수정 2022-04-07 06:33

유튜버 등 1인 크리에이터가 급증하면서 각종 영상 편집 서비스에 대한 수요가 늘었다. ‘인공지능(AI) 성우’가 대표적이다. 얼굴뿐 아니라 목소리를 감추고 싶은 크리에이터가 선호하는 서비스다. 국내에서는 네오사피엔스의 ‘타입캐스트’가 대표적인 AI 성우 서비스다.
김태수 대표가 2017년 설립한 네오사피엔스는 텍스트-음성 합성 방법 등과 관련된 특허를 다수 보유하고 있다. 전화 자동응답시스템(ARS)에서 들을 수 있는 어색한 기계음과 달리 사람이 실제 말하는 듯한 착각을 일으킬 정도로 음성 변환 수준이 높다는 평가다. 퀄컴, KAIST 등 출신 네오사피엔스 연구진은 2017년 음성 합성에 소리의 운율과 높낮이 등을 적용해 사람의 감정도 AI로 표현할 수 있는 기술을 처음으로 선보였다.
네오사피엔스는 자체 기술을 바탕으로 이용자가 원하는 문자 내용을 고품질 오디오 콘텐츠로 변환하는 ‘타입캐스트(Typecast)’라는 서비스를 운영하고 있다. 슬픔, 기쁨, 분노 등 다양한 감정 표현도 자유자재로 가능하다. 지난 2월 기준 누적 가입자 100만 명이 넘는다. 지난해 1년 동안 타입캐스트를 통해 제작된 콘텐츠의 음성 길이는 3만 8000시간에 달한다. 가상 연기자 캐릭터의 수는 한국어와 영어를 포함해 170명이 넘는다. 미국, 캐나다, 영국 등 18개국의 사용자가 유료로 서비스를 이용 중이다.
다양한 기업과도 협업 중이다. e북 서비스업체 ‘밀리의 서재’와 AI 성우를 이용한 오디오북을 제작했다. BTS의 소속사인 하이브와 BTS 멤버들의 목소리를 활용한 콘텐츠도 만들었다. 각종 드라마, 홈쇼핑, TV 예능 프로그그램에서도 타입캐스트를 사용하고 있다.
네오사피엔스는 기술력을 인정받아 지난 2월 미국 실리콘밸리의 투자사 블루런벤처스(BlueRun Ventures)의 아시아 지역 성장 투자 플랫폼인 ‘BRV Capital Management’ 등으로부터 256억원 규모의 시리즈B(두번째 기관투자 단계) 투자 유치에 성공했다. 이번 투자에는 스틱 벤처스, 퀀텀 벤처스, 알바트로스 인베스트먼트, 대교 인베스트먼트, 타임웍스 인베스트먼트도 참여했다. 네오사피엔스의 누적 투자 규모는 318억원이다.
네오사피엔스는 이번 투자 유치로 기술과 서비스를 고도화하고 해외 시장 진출에도 집중할 계획이다. 해외 사업 거점도 마련하고, AI 개발, 서비스 운영 등 전 직군에서 우수한 인력도 확보할 예정이다. 김 대표는 “AI 가상 연기자를 활용한 미디어 분야의 세계 최고 스타트업이 되겠다”고 밝혔다.
김주완 스타트업부 기자