“텍사스 오스틴의 테슬라 본사에 설치 중인 인공지능(AI) 훈련용 슈퍼 클러스터 ‘코르텍스’ 내부 영상입니다.”
지난 26일(현지시간) 일론 머스크 테슬라 최고경영자(CEO)가 X(옛 트위터)에 올린 영상이 화제를 모았습니다. 대뇌 피질(cortex)이란 뜻의 이 슈퍼컴퓨터 센터가 공개된 건 처음입니다. 영상 속엔 수십 개의 컴퓨터를 장착한 서버랙이 도서관 서고처럼 끝없이 늘어서 있습니다. 한눈에도 보통 컴퓨터가 아님을 짐작하게 합니다.
슈퍼컴 코르텍스엔 엔비디아의 AI 서버용 그래픽처리장치(GPU) H100이 탑재됐습니다. 지난해 AI 붐을 타고 품귀현상이 벌어져 빅테크 간 확보 전쟁이 벌어진 칩입니다. 머스크도 “GPU가 마약보다 구하기 힘들다”고 혀를 내둘렀지요. 개당 가격이 3만~4만달러(약 4000만~5300만원)에 이릅니다. 작년 쿠팡에서 5000만원에 판매해 국내 네티즌들의 눈길을 끌기도 했습니다.
그렇다면 코르텍스엔 몇 개의 H100이 들어갈까요. 머스크는 지난 4월 실적발표에서 테슬라에 H100 칩 3만5000개가 가동 중이고 연말까지 8만5000개로 늘릴 것이라고 말했습니다. 이달엔 H200(차세대 엔비디아 GPU)을 포함해 10만개를 투입할 것이라고 밝혔습니다. 테슬라는 올해 AI에 10억달러(약 1.3조원)를 투자할 계획입니다. 이미 텍사스 공장 남쪽에 건물을 확장하고 슈퍼클러스터 냉각을 위한 거대한 팬을 설치하기도 했습니다.
테슬라는 왜 슈퍼컴을 설치했나
테슬라가 단순한 자동차 회사라면 엄두도 못 낼 투자입니다. SNS 기업 메타는 자사 AI ‘라마 3’를 훈련하기 위해 H100 2만5000개를 장착한 클러스터를 활용 중입니다. 마크 저커버그 CEO는 이마저도 모자란 듯 일반인공지능(AGI) 연구를 위해 H100 35만개를 확보할 예정이라고 밝힌 바 있습니다. 메타는 구글, 마이크로소프트(MS) 등과 함께 AI 개발에 진심인 회사입니다. 다시 말해 테슬라 역시 AI에 명운을 걸었다는 얘기입니다.테슬라는 왜 AI에 대대적인 투자를 하는 걸까요. 바로 자율주행과 인간형 로봇 옵티머스를 발전시킬 목적입니다. 테슬라의 자율주행 시스템은 카메라와 AI에 의존하는 ‘완전 비전 중심 방식(Heavily Vision-based Approach)’입니다. 운전자들의 차량과 카메라 등에서 수집한 데이터를 모아 라벨링을 거친 후 실제 세계를 3D로 재구성하고 운전을 학습시킵니다. 이를 ‘비전 AI’ 모델이라고 합니다.
북미 테슬라 운전자 40만명이 사용 중인 FSD(완전자율주행)의 주행 거리는 최근 16억마일(약 26억㎞)을 돌파했습니다. 이 막대한 양의 주행 데이터 중 양질의 데이터를 골라 AI에 학습시키는 겁니다. 이 과정을 빠르게 할 수 있다면 어떨까요. 더 좋은 성능의 컴퓨터가 필요하겠지요. AI 훈련용 컴퓨팅 파워가 커질수록 완전자율주행에 이르는 시간을 단축할 수 있다는 게 머스크의 생각입니다. 이 때문에 빅테크 뺨치는 수준의 슈퍼컴을 설치한 것입니다.
테슬라는 옵티머스에도 FSD와 같은 비전 AI를 활용합니다. 로봇이 실제 3D 세상에서 움직이고 작동하는 것이 자동차 운전과 같은 원리라고 보는 겁니다. 그렇다면 옵티머스의 성패는 AI 훈련에 달렸고 AI가 로봇의 두뇌가 되는 셈입니다. 지난해 삼성증권은 이 비전 AI 모델의 가치가 3368억달러(약 449조원)에 달할 것이라고 분석했습니다.
머스크의 xAI도 슈퍼컴퓨터 구축
머스크가 슈퍼컴을 구축한 기업은 테슬라뿐만이 아닙니다. 그가 지난해 설립한 AI 스타트업 xAI는 테네시주 멤피스에 슈퍼클러스터를 설치 중입니다. 지난 7월 머스크는 “H100 10만개가 탑재될 세계 최강의 AI 훈련용 클러스터”라고 밝혔습니다. 이 슈퍼컴은 xAI의 대규모언어모델(LLM) 챗봇 그록(Grok)을 훈련하는 데 활용됩니다. 오픈AI의 챗GPT와 경쟁하는 모델이지요. 현재 그록은 X의 유료 구독자들에게 서비스 중입니다.머스크의 두 개 기업이 AI에 대규모 투자를 하는 만큼 논란도 불거졌습니다. 지난 6월 CNBC는 머스크가 당초 테슬라에서 주문한 H100 칩을 X와 xAI에 먼저 배송하도록 지시했다고 폭로했습니다. 원래 작년 말 테슬라에 공급될 예정인 GPU 1만2000개가 X에 배정됐고 대신 지난 1월과 6월에 예정된 X의 H100 1만2000개 주문은 테슬라로 재배정됐다는 것입니다.
머스크가 테슬라를 제치고 개인 기업인 xAI를 챙긴 게 아니냐는 지적이었지요. 이에 머스크는 “당시 테슬라에 H100 칩을 설치할 장소가 없었기에 (주문을 바꾸지 않았다면) 창고에 그냥 쌓아뒀을 것”이라고 해명했습니다. 이해상충 논란은 접어두고 H100 확보 경쟁이 얼마나 시간을 다투는 싸움인지 알 수 있는 사건이었습니다.
그런데 ‘도조’는요?
이쯤 되면 테슬라 팬들은 하나의 질문에 도달하게 됩니다. 테슬라가 자체 개발한 슈퍼컴퓨터 도조(Dojo)는 도대체 어떻게 되는 걸까요? 도조는 자율주행 AI 훈련에 최적화된 컴퓨터로 2021년 ‘AI 데이’ 행사에서 처음으로 공개됐습니다.테슬라는 도조에 자체 개발한 D1 칩을 적용했습니다. 가격이 치솟은 엔비디아 GPU의 의존도를 낮추고 비용을 절감하려는 전략이었지요. 작년 머스크는 도조에 10억달러를 투자하겠다고 밝힌 바 있습니다. 당시 모건스탠리가 테슬라 목표주가를 400달러로 올렸던 것도 도조의 잠재력을 높이 평가한 덕분이었습니다. 도조가 자율주행과 로봇의 두뇌 역할을 맡는다는 분석이었지요.
하지만 최근 테슬라가 H100 칩을 대거 구매하면서 도조 프로젝트는 다소 뒤로 밀린 모양새입니다. 이미 조짐은 작년 말부터 있었습니다. 5년간 이 프로젝트를 이끌었던 가네시 벤카타라마난 오토파일럿 하드웨어 부문 이사가 돌연 테슬라를 떠났고 이어 핵심 엔지니어 한 명도 퇴사했습니다. 벤카타라마난은 과거 AMD에서 칩 설계를 했던 베테랑이었습니다. 그의 퇴사 이유는 알려지지 않았습니다.
빅테크 간 AI 경쟁이 치열해지자 머스크 역시 도조의 완성을 기다릴 수만은 없다고 판단한 듯합니다. 최근 그는 도조에 대해 “성공 가능성이 작지만 잠재력은 크다”며 장기적인 베팅이라고 말했습니다. 프로젝트가 아직 살아있다는 얘기입니다. 이달 초 테슬라는 뉴욕 버팔로 공장에 5억달러(약 6600억원) 규모의 도조 슈퍼컴퓨터 투자를 할 것이라고 연초 계획을 재확인했습니다.
이것이 현실화한다면 테슬라는 텍사스와 뉴욕 두 곳에 AI 거점을 마련하는 셈입니다.
월가의 상당수 분석가는 테슬라의 AI 투자에 긍정적입니다. 하지만 부정적인 의견도 있습니다. 지난 28일 UBS의 패트릭 험멜 연구원은 테슬라 주식에 목표주가 197달러 ‘매도’ 의견을 냈습니다. 그는 “테슬라의 AI 투자 비용이 과도한 것에 비해 AI로 얻을 수 있는 수익은 예상보다 매우 늦어질 가능성이 있다”며 “테슬라는 다음 분기에 바로 수익을 낼 수 있는 사업에 투자해야 한다”고 경고했습니다.
▶‘테슬람이 간다’는
‘모빌리티 & AI 혁명’을 이끄는 혁신기업 테슬라의 뒷이야기를 풀어갑니다. 최고의 ‘비저너리 CEO’로 평가받는 일론 머스크도 큰 탐구 대상입니다. 국내외 테슬라 유튜버 및 X 사용자들의 소식과 이슈에 대해 소개합니다. 아래 기자 페이지를 구독하면 매주 기사를 받아볼 수 있습니다.
백수전 기자 jerry@hankyung.com