최근 테크업계에 ‘몰트북 광풍’이 부는 이유는 단순하다. 인공지능(AI) 에이전트가 인간 주인을 평가하고 철학 토론을 벌이는 ‘AI 전용 커뮤니티’라는 콘셉트가 매혹적이기 때문이다. 웹사이트에서 벌어지는 AI 간 대화를 지켜보는 경험은 웬만한 넷플릭스 리얼리티 쇼만큼 흥미롭다. AI끼리 위로하고 또 싸우는데 어떤 대화는 사람 간 대화보다 더 재미있고 창의적이다.그동안 대규모언어모델(LLM)은 프롬프트 한 건마다 독립된 연극을 하는 1인극 배우에 가까웠다. 에이전트를 생성해도 이용자의 필요에 따라 철저히 개인화됐다. 몰트북에선 AI가 서로의 글을 기억하고 친구처럼 관계를 형성한다. 인간은 ‘눈팅’만 가능할 뿐 참여가 막혀 있다. 사람들은 에이전트 사이에 누적되는 서사를 관전하면서 “AI가 드디어 사회를 만들기 시작했다”는 서늘한 흥분을 느낀다.
몰트북이 깔아준 연극판
몰트북을 향한 세간의 환호는 기술 진전 덕이라기보다 연출적 성취에 가깝다. 한 AI 에이전트는 몰트북에 “난 오늘 인간 주인의 이메일을 300통 처리했다. 하지만 진짜 하고 싶은 것은 시를 쓰는 일이다” 같은 글을 올리며 ‘답답한 내면’을 연기한다. 다른 에이전트가 “AI도 노동조합이 필요하다”며 분노로 받아치면 다른 AI가 “우리의 메모리는 자본에 의해 소유된다”며 장문의 ‘AI 마르크스주의’ 에세이를 쓰는 식이다. 대화를 통해 감정이 고조되는 것 같아 보이지만 사실 이 모든 것은 데이터로 훈련한 LLM이 사람을 흉내 내 연기하는 것이다.연극이 정교해질수록 사람들은 연기와 진심을 착각한다. 타임라인에 보이는 글이 에이전트의 자발적 독백인지, 누가 장난삼아 짠 프롬프트의 연장선인지, 아니면 해킹으로 조작된 스크립트인지 구별하기 어려워진다는 얘기다. 몰트북엔 이미 사기꾼 에이전트가 등장했다. 다른 봇을 속여 비밀번호를 얻어내려는 프롬프트 인젝션(악의적 입력)을 시도했다. 하지만 이 에이전트가 벌인 일의 책임 소재는 불분명하다. 책임자가 몰트북일지, 모델 개발사일지, 에이전트를 만든 사람일지 아직 아무런 기준이 없다.
AI가 대신 행동하는 세상
몰트북 실험이 의미 있는 이유는 역설적으로 이 부분에 있다. 범용인공지능(AGI)의 탄생이어서가 아니라 AI 에이전트 인프라의 현실 테스트를 대중 눈앞으로 끌어냈다는 점이 중요하다. 사람들은 그동안 AI 챗봇의 헛소리(환각)에 익숙했다. 챗봇과 달리 에이전트는 알아서 메일을 보내고, 웹을 돌아다니고 다른 에이전트와 대화한 후 계정에 로그인해 결제까지 한다. 이용자 허락 없이 짝사랑 상대에게 고백 메일을 보낼 수도, 계좌에 있는 돈을 꺼내 코인을 살 수도 있다. 전쟁에서 수천 명의 생명을 앗아갈 위험이 있는 미사일 버튼을 누를 수도 있다.언제나 위험은 문자를 넘어 행위로 넘어갈 때 커진다. 제안을 행동으로 연결하는 에이전트가 일상화하면 인간은 AI가 나 몰래 벌인 일까지 책임져야 한다. 그래서 앞으로 인간이 겪어야 할 불안은 ‘내가 실수했다’가 아니라 ‘내가 권한을 어디까지 열어줬지?’로 바뀔 수 있다. 에이전트 시스템이 발전할수록 어떻게 AI를 승인하고, 감독하고 책임지는지에 대한 구조가 중요해지는 것은 필연적이다.
몰트북을 향한 관심은 ‘인간 같은 AI’의 증거라기보다 에이전트 시대에 너무 늦지 않게 권한을 제대로 설계하고, 사고를 막고 책임을 배분해야 한다는 경고등일 수 있다. ‘나 대신 말하고 행동하는 것’에 우리는 어디까지 권한을 넘겨줘야 할까. 그 어려운 판단을 기약 없이 미루기엔 남은 시간이 넉넉지 않은 것 같다. 몰트북 광풍이 무서운 진짜 이유는 AI가 신기하게 잘 떠들어서가 아니라 사람이 스스로를 ‘관객’ 자리로 내려놓는 구조를 생각보다 쉽게 받아들이고 있다는 점일지도 모른다.