딥마인드의 게임AI '알파스타'
인간과 '스타2' 경기서 10승1패
1주일간 인간 200년 분량 학습
스타크래프트는 실시간 전략게임
AI가 계산할 시간 거의 없어
바둑보다 훨씬 난이도 높아
[ 김주완 기자 ]
게임 시작 4분41초 후 ‘스타크래프트2’ 인공지능(AI)인 ‘알파스타’의 공격이 시작됐다. 곤충 모양의 유닛(병력) ‘추적자’ 5개를 앞세워 적진으로 향했다. 첫 번째 공격은 수비에 밀려 후퇴했다. 그 사이에 만들어 놓은 추적자를 계속 투입했다. 한 곳에 공격을 집중해 파괴력을 극대화했다. 아군의 피해는 최소화했다. 공격을 개시한 지 2분30초 만에 프로게이머는 버티지 못하고 “GG(good game·기권)”를 선언했다. 구글의 AI 자회사 딥마인드와 게임업체 블리자드가 25일 처음으로 공개한 AI와 프로게이머 간 첫 게임 영상이다.
구글, 게임AI 영상 공개
알파스타의 승리로 AI가 체스, 바둑에 이어 PC 게임에서도 인간을 압도하기 시작했다는 평가가 나왔다. 알파스타와 프로게이머 간 녹화영상으로 공개된 10개 경기에서는 알파스타가 모두 이겼다. 생중계된 마지막 경기에서는 프로게이머가 승리했다. 10승1패로 알파스타의 압승이었다. ‘인간계’에서는 영국의 e스포츠게임구단 ‘팀 리쿼드’ 소속의 프로게이머 다리오 뷘시와 그레고리 코민츠가 출전했다. 뷘시는 지난해 ‘스타크래프트2 월드 챔피언십 시리즈’에서 44위에 이름을 올렸다. 코민츠는 같은 대회에서 13위를 차지했다.
이번 경기에서는 AI와 인간 간 공평한 게임 진행을 위해 알파스타의 ‘분당 게임 조종속도(APM)’를 277로 고정했다. 프로게이머는 보통 평균 300대 수준을 유지한다. 알파스타는 게임에서 선택할 수 있는 종족 중 프로토스만 공부한 상태여서 프로토스로 모든 경기를 소화했다.
게임에서 인간 넘어서나
정보기술(IT)업계에서는 이번 경기를 통해 구글의 AI 수준이 한층 높아졌다고 분석했다. 그동안 어떤 AI도 프로게이머를 상대로 이긴 적이 없었다.
2017년 국내에서 치러진 첫 ‘인간 대 AI의 스타크래프트 대결’에서 국내 프로게이머가 4 대 0으로 완승했다. 전략 시뮬레이션 게임인 스타크래프트는 바둑보다 AI가 접근하기 어려운 분야로 꼽힌다. 바둑과 달리 AI는 완전한 정보를 얻지 못한다.
바둑판에서는 모든 돌이 보이지만 스타크래프트에서는 이용자가 정찰하지 않은 지역은 검은 안개로 가려져 있다. 정찰을 해도 시간이 지나면서 적이 어디로 움직이는지 알 수 없다. 바둑은 선수가 교대로 돌을 두면서 계산할 여유가 있다. 스타크래프트는 실시간 게임이어서 AI가 연산할 시간이 부족하다.
또 바둑은 돌 하나의 선택만 고민하면 되지만 스타크래프트에서는 수십 종의 유닛을 한번에 관리해야 한다. 오리올 빈얄스 딥마인드 연구원은 “바둑은 돌을 둘 수 있는 곳이 최대 361개지만 스타크래프트의 선택지는 1억 개 이상”이라고 설명했다. 딥마인드는 바둑의 알파고처럼 이미 공개된 프로게이머의 경기 내용으로 알파스타를 훈련시켰다. 알파스타를 여러 버전으로 나눈 뒤 서로 대전하는 방식으로 학습 단계를 높였다. 알파스타가 2주일간 연습한 양은 인간 기준으로 200년에 해당한다.
아직 갈 길은 멀어
알파스타도 알파고처럼 인간이 활용하지 않은 전략을 보여줬다. 처음부터 본진의 입구를 막고 초반 공격을 방어하는 프로게이머들과는 달랐다. 알파스타는 대부분 경기에서 입구를 막지 않았다. 유닛 제어 능력과 자원 수급은 프로게이머를 압도하기도 했다. 기습공격하고 피하는 시점이 절묘했다.
뷘시는 “알파스타가 이전에는 생각하지도 못한 전략을 보여줬다”고 평가했다. 코민츠는 “애초 기대하지 않았던 인간적인 경기운영 방식이 인상적이었다”고 말했다. 아직 갈 길이 멀다는 지적도 나온다. 국내 게임AI 개발회사 관계자는 “알파스타가 세계 최고 수준의 게임AI지만 인간과 100% 같은 조건으로 경기에 나서면 인간을 압도하지는 못할 것 같다”고 주장했다.
김주완 기자 kjwan@hankyung.com