글로벌 영상 이해 기반 멀티모달 AI 기술 개발 스타트업 트웰브랩스(TwelveLabs)가 넷플릭스 코리아를 통해 공개된 SBS 특집 다큐멘터리 '넥스트 샘 올트먼'에서 차세대 AI 혁신을 이끌 핵심 기업으로 주목받았다.
지난 9일 SBS 방송 후 넷플릭스에 공개된 이 다큐멘터리는 오픈AI 샘 올트먼 대표의 한국 언론사 최초 단독 인터뷰를 중심으로, ‘챗GPT 이후의 AI’를 집중 조명했다.
트웰브랩스는 퍼플렉시티(Perplexity), 피지컬 인텔리전스(Physical Intelligence) 등과 함께 실리콘밸리를 대표하는 혁신 기업 중 하나로 소개되었다. 특히 영상 AI 기업 중에서는 유일하게 트웰브랩스가 등장하여 ‘멀티모달 AI’의 선두주자로 인정받았다.
다큐멘터리에서 샘 올트먼은 오픈AI의 동영상 생성 서비스 ‘Sora 2’에 대한 비전을 묻는 질문에 “이것이 무엇인가에 대한 정의는 시간이 지나며 계속 발전해 갈 것”이라고 답했다. 이어 “이 아이디어의 핵심은 세상이 텍스트로 이어져 있지 않다는 것”이라며, “풍부한 경험과 창의적인 표현을 가능하게 하려면 텍스트 말고도 다양한 양식이 필요하다”라고 강조했다. 차세대 AI 기술로 멀티모달 AI, 영상 이해 능력 등의 중요성을 명확히 제시한 것이다.
이어 텍스트를 넘어 다른 형태의 데이터로도 도전하고 있는 AI 기업으로 트웰브랩스가 등장해, 영상 AI 분야에서 이러한 비전을 실현하고 있는 기업으로 소개되었다.
다큐멘터리는 ‘손흥민이 골을 넣은 후 세리머니 하는 장면을 모아서 검색해줘’라는 요청에 즉시 응답하고, 넷플릭스 시리즈 ‘오징어게임’의 하이라이트 장면이나 NBA의 3점 슛 장면을 초 단위로 찾아내는 트웰브랩스의 영상 이해 기술을 생생하게 보여줬다.
특히 ‘한국의 팔란티어’를 꿈꾸는 트웰브랩스가 국방, 치안, 안보 등 공공 분야에서 낸 구체적인 성과도 소개되었다. 특히 미국 내슈빌 총기 난사 사건에서 트웰브랩스가 이러한 영상 분석 기술을 통해 미국 정부 기관과 협업한 사례를 통해 영상 이해 AI가 현실 세계의 실제 문제를 해결하는 과정을 생생하게 보여 주었다.
대한민국 육군 사이버 사령부에서 만난 선후임끼리 창업했다고 창업 스토리를 들려준 이재성 트웰브랩스 대표는 “영상은 인간의 메모리랑 굉장히 비슷하다고 생각한다”며 “최대한 세상을 잘 이해할 수 있는 시스템을 만들려면 결국 영상을 잘 활용해야 하지 않을까”라고 기업 철학을 밝혔다.
언어모델 이후에 투자처를 찾고 있던 벤처캐피털들은 한눈에 이들의 가능성을 알아보았고, 트웰브랩스는 전략투자라운드에서 3천만 달러 투자를 유치하는 등 글로벌 선두에서 멀티모달 영상 분야를 개척해 가고 있다.
이재성 대표에게 LLM의 다음을 묻자 “전 세계에 이미 90%의 데이터가 영상이고, 만약에 앞으로 나올 서비스들, 언어모델들의 눈과 귀가 될 수 있다면 샘 올트먼 대표님보다 더 훌륭해질 수도 있지 않을까”라고 답했다. 이승준 CTO 역시 “저희는 영상 이해, 즉 세상을 이해하는 초지능을 개발하고 있다”며 “저희는 몇 년 안에 이뤄내려고 하지 않을까 생각한다”라고 포부를 밝혔다.
'넥스트 샘 올트먼'은 9일 SBS 방송 후 넷플릭스에도 공개되어 글로벌 시청자들에게 한국 AI 기업의 기술력을 알리는 계기가 됐다. 서울 DDP에서 열리는 'SDF2025 포럼'에서도 상영된다.
트웰브랩스는 영상 데이터를 텍스트처럼 이해하고 검색할 수 있는 독자적 기술을 보유한 기업으로, 방대한 영상 콘텐츠에서 특정 장면, 객체, 행동, 맥락을 정확히 파악하고 분석한다. 이는 텍스트 기반 LLM이 한계에 도달한 시점에서, 멀티모달 AI의 핵심 기술로 평가받고 있다.
특히 국방, 치안, 의료, 미디어 등 다양한 산업에서 영상 데이터의 중요성이 급증하는 가운데, 트웰브랩스의 기술은 실시간 영상 분석과 의사결정 지원에 필수적인 인프라로 자리 잡고 있다.