알파고 5:0 승리 예측한 최대선 교수 '이세돌이 이길수 없는 이유'

 

필자의 알파고 5:0 승리 예상 중 첫 번째 게임이 끝났다. 10일은 두번째 대국이 열린다. 그 결과는 필자의 예측과 다르지 않을 것이다.  

예상을 위해 필자가 주목한 것은 알파고의 학습 데이터였다. 

알파고는 지난해까지 아마추어 기보만을 학습해서 판후이 프로 2단을 이겼다. 

이후 프로 기사들의 기보는 물론, 이세돌 9단이 사용하게 될 수많은 변칙과 창의적인 수를 자체 대국을 통해 학습했다면, 그 실력이 이세돌 9단을 능가할 것이라고 봤기 때문이다.
    
인간은 직관과 창의력이 있는 반면, 컴퓨터는 계산만 할 뿐, 창의적 수를 낼 수 없다. 때문에 인간이 이길 거라는 예측이 많았다. 하지만 알파고가 사용한 딥러닝은 곧 직관을 의미한다.

직관이란 '왜'라는 답을 내놓았는지 설명할 수 없지만, 문제가 주어지면 답을 내놓는 것을 의미한다. 

이는 신비로운 과정이 아니라 경험과 학습을 통해 형성된 뇌신경 구조가 자극(입력)을 받아 내놓는 신호(출력)일 뿐이다. 

딥러닝에 사용되는 심층신경망은 바로 이 직관을 흉내 낸 것으로, 입력에 대해 요구되는 출력을 훈련한 것이다.

이세돌 9단은 수많은 학습과 경험을 통해 그 직관 뇌신경 구조를 발달시켜 왔을 것이다. 하지만 바로 그 학습과 경험을 의미하는 데이터의 양에서 알파고에 밀렸을 뿐이다.

이세돌 9단의 직관은 바둑의 역사 동안 축적되고 정련된 수많은 정석과 기보를 학습했고 수많은 대국을 거쳐오며 경험을 쌓았겠지만, 바둑 경우의 수는 우주의 원자보다 많아 인간이 시도해 본 수는 전체 중에 극히 일부일 따름이다.

알파고는 이러한 인간의 경험치에 더해 인간의 역사에서 시도해 보지 못했던 수많은 수들을 자체 대국을 통해 시도해 보고 그 결과를 학습했다.

"인간이라면 두지 않았을 수"라는 말이 나온 것은 당연한 결과이며, 이세돌 9단이 사용한 변칙공격에 제대로 대응한 것도 변칙 수들이 이미 학습돼 있기 때문이다.

직관을 제외하면 남은 것은 게임 전개를 예상해 보는 수읽기와 심리전, 변칙과 흔들기 같은 것인데 심리전은 컴퓨터에겐 통하지 않고, 변칙과 흔들기 수는 이미 학습됐을 가능성이 높다.

트리탐색을 의미하는 수읽기는 원래 컴퓨터가 압도하는 영역이다. 대국 후반이 되어 모든 경우의 수 계산이 가능해지는 단계부터는 컴퓨터가 100% 유리하다.
 
이세돌 9단이 첫 번째 대국을 통해 알파고의 기풍을 파악했고, 평정심을 되찾아 두 번째 대국부터는 승리할 수 있을 것이라는 예측들이 많지만, 필자의 예상은 여전히 5:0 알파고의 승리다.

<최대선 교수 약력>
KAIST 전산학과 박사
(전) 현대정보기술 연구소 선임
(전) ETRI 사이버보안연구본부 인증기술연구실장
(현) 공주대학교 의료정보학과 부교수

econews@eco-tv.co.kr

저작권자 © 그린포스트코리아 무단전재 및 재배포 금지