95년생 '천재 소녀'에 美 발칵…6개월 만에 3900억 '대박' [조아라의 IT's fun]

입력 2023-12-24 14:10

수정 2023-12-24 14:12

다니던 학교를 그만두고 올해 4월 인공지능(AI) 스타트업을 창업한 1995년생 '천재소녀'가 미국 실리콘밸리에서 화제가 되고 있다. 회사 설립 6개월 만에 오픈AI 창립 멤버 안드레아 카르파티, 깃허브 전 최고경영자(CEO) 출신 넷 프리드먼, 지식 공유 플랫폼 쿼라(Quora) 설립자 애덤 디엔젤로 등 세계 AI 업계 유명 인사들의 관심을 끌어모으며 무려 5500만달러(약 716억원)의 자금을 끌어모았다.반년 만에 3900억…AI 스타트업 창업한 95년생 '천재소녀'
24일 업계에 따르면 미국 스탠퍼드대 AI 연구소 박사생 출신 궈원징(郭文景)이 동료들과 함께 올 4월 설립한 AI 스타트업 피카랩스(Pika Labs)가 혜성처럼 등장해 주목받고 있다. 피카랩스는 지난달 29일 AI 동영상 생성 서비스 애플리케이션(앱) '피카 1.0'을 출시했다. 텍스트를 입력하면 3D 동영상, 애니메이션, 영화 등을 생성하고 편집할 수 있다. 자연스러운 움직임과 사실적인 영상 품질 등으로 화제를 모았다.

현재까지 피카랩스의 서비스 이용자 수는 60만명 수준이다. 매주 약 100만개 영상 콘텐츠가 생성된다. 1년도 채 되지 않은 회사지만 기업 가치 평가액은 총 3억달러(약 3900억원)에 이른다. 정식 서비스 출시 이전 시범 테스트 기간 실리콘밸리 투자자로부터 유치한 투자금만 5500만달러에 달한다. 생성형 AI 열풍에 힘입어 그야말로 '대박'이 난 셈이다.

'피카 1.0'의 사용 방법은 어렵지 않다. 원하는 문구, 예건대 "일론 머스크가 우주복을 입고 우주를 여행하게 해줘"라고 입력하면 몇 초만에 3D 애니메이션을 뚝딱 만들어준다. 영상 배경에 머스크가 설립한 우주탐사 기업 스페이스X가 등장하는 식이다. 사용자가 직접 영상 종류를 선택할 수 있고, 길이도 조정할 수 있다. 또한, 기존 동영상 요소를 수정하거나, 교체할 수도 있다. 영상의 품질과 정확도, 논리적 연관성이 높아 현재까지 출시된 AI 서비스 가운데 뛰어나다는 평가를 받고 있다. 출시 일주일 만에 실리콘밸리에서 입소문이 나기 시작했다.

테슬라 AI 연구개발 책임수석이자 피카랩스의 투자자인 '안드레아 카르파티'는 '피카 1.0' 영상 콘텐츠를 리트윗한 뒤 "누구나 영화 인셉션에 나오는 건축가처럼 멀티모달 꿈의 감독이 될 수 있다"고 호평했다. 다른 사용자 역시 "영상 효과가 매우 놀랍다" "머지 않아 어느 누구나 휴대폰으로 영화 전체를 만들어낼 수 있을 것"이라며 긍정적인 반응을 내놓고 있다.공모전 실패하자 명문 '스탠퍼드' 자퇴하고 창업
놀랍게도 피카랩스의 창업 계기는 공모전에 실패하면서부터다. 스탠퍼드대 AI 연구소 박사생으로 있던 궈원징은 당시 상금 1만달러(약 1300만원)를 내건 '제1회 AI 영화제'에 자신만만하게 참가했으나 수상에 실패했다. 하버드대에 조기 입학할 정도로 중국에서 '천재소녀'로 불리고 있는 데다 메타 AI 리서치의 최연소 직원으로 일할 만큼 실력에 자신감이 있었던 궈 씨가 의외의 결과를 받아든 것이다.

대회를 준비하는 과정에서 그는 시중에 출시된 영상 제작용 AI 프로그램에 대해 매우 불만족스러웠다고 한다. 최근 AI 기술이 비약적으로 발전했지만 실제 영상 적용 과정이 번거롭고, 투입 시간 대비 결과물이 형편없었다고 봤다. 결국 그는 스탠퍼드 박사과정 동료인 멍첸린(孟晨琳)과 함께 학교를 그만두고 일반인들이 손쉽게 사용할 수 있는 AI 영상 제작 프로그램 개발에 착수했다. 올 11월 '피카 1.0' 정식 출시 전 시범 테스트 기간 선보인 AI 영상 콘텐츠들은 틱톡에서 조회수 3000만회에 달할 정도로 대중들의 반응이 뜨거웠다.

현재 피카랩스는 새로운 AI 모델을 구축 중이다. 내년 인력 규모를 현재의 5배 수준인 20명으로 늘리고 다양한 유료 구독 모델을 선보일 계획이다. 전문가들은 향후 피카랩스의 서비스가 광고, 영화, 교육 등 다양한 영역에서 광범위하게 활용될 것으로 예상하고 있다.연평균 37% 성장하는 AI '텍스트·영상 변환 시장'
챗GPT 출시를 계기로 세계적으로 AI 열풍이 불면서 관련 서비스가 우후죽순 생겨나고 있다. 과거 텍스트에 초점을 둔 모델에서 이미지, 음성 등 여러 종류의 데이터를 동시에 처리할 수 있는 '멀티모달' AI 서비스가 최근 속속 출시되고 있다.

실제로 지난달 스테이블 디퓨전 개발사인 스테이블 AI(Stable AI)는 기존 텍스트·이미지 모델의 확장판인 최신 AI 모델 '스테이블 비디오 디퓨전(Stable Video Diffusion)'를 선보였다. 같은달 메타도 텍스트와 이미지 입력을 기반으로 비디오를 제작하는 '에뮤 비디오(Emu Video)'를 공개했다. 틱톡 개발사 바이트댄스도 텍스트와 사진으로 비디오를 생성할 수 있는 '픽셀댄스(PixelDance)'를 내놓았다. 런웨이는 지난 3월 텍스트, 이미지, 비디오를 입력하면 새로운 비디오를 생성하는 '젠-2(Gen-2)'를 출시한 바 있다. 어도비(Adobe)도 최근 텍스트·비디오 AI 플랫폼 리프레이즈(Rephrase.ai)를 인수했다고 발표한 바 있다. 국내에서도 딥브레인AI이 영상 메시지를 전달할 수 있는 AI 휴먼 서비스를 제공하고, 플루닛 역시 AI 기반 영상 생성·방송 플랫폼 '플루닛 스튜디오'로 가상인간 영상을 제작할 수 있도록 하는 서비스들이 나오고 있다.

전문가들은 이같은 텍스트·영상 기반 AI 시장이 크게 성장할 것으로 내다보고 있다. 시장조사기관 마켓앤마켓(MarketsandMarkets) 보고서에 따르면 글로벌 '텍스트·비디오 변환 AI' 시장은 2027년까지 5년간 연평균 성장률(CAGR) 37.1%를 기록하며 고속 성장할 전망이다. 지난해 1억달러(약 1300억원)로 추정되는 시장 규모는 9억달러(약 1조1800억원)으로 크게 증가할 것으로 예상된다. 보고서는 "특히 식음료 분야 콘텐츠가 가장 빠르게 성정할 것"이라며 "영상은 시각적 효과가 뛰어나 소비자들의 의사결정 시간을 줄여주고, 긍정적인 브랜드 이미지를 만들어준다"고 말했다.

조아라 한경닷컴 기자 rrang123@hankyung.com