문병로 서울대 컴퓨터공학부 교수 "알파고, 이번엔 질 것…다음 승부는 장담 못해"

와우넷 오늘장전략

나스닥·S&P500 이틀째 최고치...AMD 7%↑ - 와우넷 오늘장전략

굿모닝 주식창

반도체 쌍두마차↑코스피 신고가 돌파! - [굿모닝 주식창]

앱으로 보는 시장

한화에어로스페이스, 방산주 재도약의 신호탄 되나? - [앱으로 보는 시장]

입력 2016-03-06 20:03

알파고·이세돌 대결 이렇게 본다

알파고의 바둑 실력은…
3000만 수·16만 판 훈련…입력값 1만7000개 넘어
다음 착점 적중률 57%

인공지능, 이제 시작일뿐
발전속도 워낙 빨라 프로기사 수준 곧 능가
AI 한계 예측 어려워

전문가의 예측이 허망하게 틀리는 것을 보는 재미는 의외로 쏠쏠하다. 역발상 투자의 대가로 불리는 데이비드 드레먼에 따르면 미국 애널리스트들의 분기 예측치 50만건을 분석한 결과 평균 44%나 틀렸다. 월스트리트저널이 경제학자들의 6개월 후 금리 예측을 13년 반 동안 조사해본 결과 총 27번의 예측 중 무려 20번이나 방향이 틀린 것으로 나타났다. 공학자인 필자도 비슷한 경험을 했다.

인공지능학자도 예측 못한 발전

2009년 한 일간지 바둑전문 기자가 프로 바둑기사에게 8점을 놓고 이긴 컴퓨터 사례를 들며 언제쯤 대등한 조건에서 프로 기사를 이길 컴퓨터가 나올지 물었다. 자신있게 대답했다. “100년 내로는 절대로 못 이긴다. 추상적 사고가 큰 영향을 미치는 바둑에서는 턱도 없다.” 나는 이 의견과 일화를 지난 7년간 재미있는 안줏거리?삼았다. 2년 전에는 8점 차이가 4~5점 차이로 줄어들었지만 나는 여전히 여유만만했다.

2012년 변화의 조짐이 왔다. 세계적인 화상인식대회(ILSVRC)에 참가한 제프리 힌튼 캐나다 토론토대 교수 연구진은 딥러닝(인공지능이 외부 데이터를 분석해 스스로 의미를 찾는 학습 과정)을 통해 이미지 인식의 오류율을 26%에서 단박에 15%까지 낮추며 우승을 차지했다. 통상적 속도였으면 20년 이상 걸릴 기술적 진보였다. 이 사건을 계기로 딥러닝은 컴퓨터 과학 최고의 ‘핫 키워드’가 됐다. 구글과 페이스북은 지난해 이 기술로 팀을 꾸려 경쟁적으로 바둑에 도전장을 냈다.

그럼에도 지난해 구글이 낸 논문을 봤을 때는 내 호언장담을 조금이라도 재고할 필요가 없다고 생각했다. 구글이 지난 1월 네이처지에 발표한 알파고 논문도 접근 방식만 보면 프로 기사를 상대하기엔 역부족한 것처럼 보였다.

하지만 실제 바둑 대결의 결과는 충격적이었다. 유럽의 프로바둑 챔피언을 지낸 판후이 2단에게 다섯 번을 내리 이겼기 때문이다. 한·중·일에 비해 상대적으로 약하지만 그래도 유럽 챔피언을 압도적으로 이겼으니 알파고는 세계 정상급 기사들과는 2점차 이내로 바짝 따라 붙은 것이다.

하드웨어 진보 인공지능 훈련효과 높여

알파고가 다른 바둑 프로그램들을 압도하게 된 결정적인 요인은 두 가지다. 하나는 탐색 비율을 현저히 높인 것이고, 범용그래픽처리장치(GPGPU)로 상징되는 계산 성능의 혁명적 진화도 있었다. 알파고는 인공신경망의 舊씬?정책망과 가치망을 결합한 기술이다.

정책망은 다음 착점 후보들을 추려내는 역할을 하고, 가치망은 어떤 착점이 놓인 후의 승리 가능성을 가늠하는 역할을 한다. 알파고는 이들 신경망 구조를 활용해 유리한 판세를 학습했다. 지금까지 총 3000만 수, 판수로는 16만 판을 훈련했다. 지난해 구글이 낸 논문에서는 알파고가 다음 착점을 예상한 적중률은 49.6%였지만 현재 57%까지 향상됐다. 그만큼 불필요한 착점 탐색이 현저히 줄었다. 알파고의 신경망은 상상을 초월할 정도로 방대하다. 바둑판은 가로세로 19칸씩 총 361칸인데 알파고는 이 각각의 칸에 48가지의 특징값을 할당한다. 현재 놓여진 돌의 색깔, 돌이 놓인 시간, 주변에 빈칸이 얼마나 많은가, 착점 직후 각 자리 주변에 빈칸이 얼마나 많은가, 합법적으로 돌을 놓을 수 있는 자리인가 등이 고려 대상이다. 각각의 칸마다 48개 특징값이 지정되다 보니 입력값만 1만7328개가 된다. 알파고는 이런 입력값과 출력값 사이에 여러 층을 만들어 6억개 이상 연결 선을 가진 거대한 신경망을 만든다.

이것을 가능하게 해준 것이 바로 GPGPU다. 원래 GPU는 그래픽계산 속도를 단축해주는 장치였지만 이제는 일반 계산에 활용되고 있다. 여기에 몬테카를로 시뮬레이션이 결합하면서 인공지능의 실력이 탁월해졌다. 경우의 수가 너무 많지만 임의로 추출한 사례로부터 근사적 결론을 내는 방식이다. 알파고는 이를 정책망과 가치망을 결합해 더 많은 의미있는 착점을 찾을 수 있다.

이세돌 어지럽게 둘수록 유리

알파고의 놀라운 점은 그다지 놀랍지 않은 기술로 이 정도 결과를 내고 있다는 것

다. 실력도 계속 늘고 있다. 알파고는 적당히 좁은 지역에서 판을 마무리하는 능력, 판세가 정해질 때의 전투에 유리하다. 컴퓨터의 계산 능력을 발휘할 수 있는 경우들이다. 지난해 판후이 2단과의 대국에서도 최대한 판을 단조롭게 끌어가려는 경향이 있었다. 이세돌 9단이 초반에 국소적으로 여기저기 확정해 버리는 운영방식은 피하는 것이 좋다.

세력의 추상적 위력, 추상적 관계 같은 부분은 이세돌에게 못 미친다. 넓은 지역에서 어지럽게 벌어지는 전투는 이세돌에게 유리하다. 판후이 2단과의 2국에서 알파고는 중후반에 상대의 말을 쉽게 잡을 수 있는 곳에서 실수를 했다. 위쪽으로 공간이 열려 있는 상황에 대해 적절한 판단을 하지 못했다. 초반 포석과 마찬가지로 돌이 많이 없는 상태에서 팻감 가치를 판단하는 정확도도 떨어지는 것으로 보인다. 이세돌 9단은 상대방을 흔드는 데는 일가견이 있어 알파고가 고전할 가능성이 크다.

인공지능이 바둑기사 조만간 이길 수도

알파고에 대해 잘못 알려진 것도 많다. 대표적인 오해가 알파고가 이세돌과 상대하면서 실력이 늘어 매번 더 세질 것이란 주장이다. 하지만 이는 사실과 다르다. 대국 중에는 알파고는 학습을 하지 못한다. 제아무리 알파고라도 이세돌과 둔 몇 판으로 실력이 향상될 가능성은 적다. 16만 판의 방대한 데이터 속에 이세돌과 둔 몇 판의 데이터가 더해진다고 영향을 미치긴 어렵다.

구글은 알파고가 중국 룰로 훈련했기 때문에 양해를 구했다고 한다. 이세돌이 이 룰에 익숙하지 않기 때문에 이세돌에게 나쁜 영향을 미칠 수도 있다. 하지만 이번 경기는 이세돌이 이길 것이다. 인공지능은 많은 일을 할 수 있지만 한계가 뭔지 아직 분명하지 않다. 알파고가 앞으로 몇 년간 이룰 진보는 족히 50년의 진보에 해당하는 것이 될 가능성이 있다. 이제 필자 예측을 깨끗이 접으려고 한다. 인공지능이 이번엔 지더라도 머지않아 세계 최고의 프로기사를 이기는 쪽으로 가고 있기 때문이다.

문병로 < 서울대 컴퓨터공학부 교수 >

3월 안에 반드시 매수해야 할 3종목! 조건 없이 공개
매일 200여건 씩 업데이트!! 국내 증권사의 리서치 보고서 총집합! 기업분석,산업분석,시장분석리포트 한 번에!!
한경스타워즈 실전투자대회를 통해서 다양한 투자의견과 투자종목에 대한 컨설팅도 받으세요

[한경닷컴 바로가기] [스내커] [한경+ 구독신청]
ⓒ '성공을 부르는 습관' 한경닷컴, 무단 전재 및 재배포 금지

싫어요

후속기사 원해요

1/3

한경지면 구독신청

실시간 관련뉴스