로봇이 걷기 시작했다. 단순히 기계적인 움직임을 넘어 춤을 추고 무술을 연마하며 사람처럼 자연스러운 동작을 구현한다. 불과 수년 전만 해도 부자연스러웠던 로봇의 거동이 비약적으로 발전한 배경에는 생성형 인공지능(AI)의 기본 토대인 ‘트랜스포머 아키텍처’가 있다. 챗GPT를 비롯한 거대언어모델(LLM)에 쓰이던 알고리즘이 고성능 그래픽 연산장치(GPU) 연산력을 바탕으로 로봇의 모션 데이터에 이식된 것이다.로봇에게 일상적인 보행을 넘어 설거지 같은 섬세한 가사 노동을 수행하도록 하는 건 까다롭다. 하드웨어 발전도 중요하지만, 더 근본적인 병목은 데이터의 결핍이다. 텍스트나 이미지와 달리 로봇의 정밀한 행동 데이터는 절대적으로 부족하다. 다양한 사물과 상호작용하는 특수 상황에 대한 데이터베이스를 구축하지 못했기 때문이다.
결국 로봇 경쟁의 승패는 양질의 모션(움직임) 데이터를 누가 먼저 선점하느냐에 달렸다. 과거 테슬라가 주행 데이터를 독점해 자율주행 시장을 선도했던 전략과 같다. 현재 데이터 확보 전략은 크게 세 가지다. 가상 세계에서 학습하는 시뮬레이션, 로봇이 직접 부딪치는 현장 학습, 그리고 사람이 가상현실(VR) 기기로 로봇을 직접 조종하며 가르치는 원격 조종이다. 이 중 가장 고순도의 데이터를 얻을 수 있는 방식은 원격 조종 방식이다. 막대한 시간과 비용의 소요에도 불구하고, 데이터의 질을 포기할 수 없는 테슬라와 같은 선두 기업들이 사활을 걸고 있는 분야다.
주목할 점은 이 지점에서 중국의 추격이 매섭다는 것이다. 중국 정부는 국가 차원의 ‘로봇 모션 데이터베이스’를 구축하고 표준 모델을 보급하며, 저렴한 인건비를 무기로 수천만 건의 데이터를 축적하고 있다. 개별 기업의 자원에 의존하는 미국식 수직 계열화 모델보다 데이터 확산 속도 면에서 압도적인 우위를 점할 가능성이 크다. 이미 중국에는 국가 데이터 인프라를 믿고 100여 개 로봇 스타트업이 난립하며 무한 경쟁을 벌이고 있다.
전문가들은 학습 데이터가 수억 개 수준에 도달하는 2~3년 내에 가정용 로봇이 본격 보급되는 로봇 ‘특이점’에 도달할 것으로 전망한다. 우리나라도 중국식 물량 공세에 맞서기보다, 우리가 강점을 가진 특정 산업 현장이나 고난도 특수 케이스 위주의 정밀 데이터베이스를 전략적으로 선점해야 한다. 로봇 시대의 주도권은 더 이상 기계공학이 아닌, 누가 더 정교한 데이터 공장을 보유하느냐에 달려 있다.
우건 매뉴라이프자산운용 매니저
