알파고 vs 알파고

1. 개요2. 버전 18의 기보3. 알파고 마스터의 기보

3.1. 평가3.2. 추가 공개된 대국

4. 알파고 제로의 기보

1. 개요

알파고와 알파고의 대국. 이게 등장함으로써 인간 바둑이 상향평준화되었다고 한다.

2. 버전 18의 기보

SGF 파일
PDF 파일(영문)
이세돌과 대결 9일 전에 두어진 대국. 구글 딥마인드 챌린지 매치가 끝난 후 총 3개의 기보가 이세돌전 5판의 기보와 함께 공개되었다. 3판밖에 되지 않고 속기로 두어져 인간이 보기에도 자잘한 실수를 했기 때문에 큰 반향을 일으키지는 않았다.

3. 알파고 마스터의 기보

최고의 명국
ㅡ 월간바둑 8월호 설문조사

보러가기(SGF 파일)
구글이 바둑의 미래 서밋 이후 공개한 50국의 기보. 5월 27일부터 하루에 10판씩 공개하기로 했지만, 28일에 남은 40판이 모두 나왔다. 마침 '제22회 LG배 조선일보 기왕전' 개막식이 있었는데, 개막식에서도 기사들은 알파고 바둑을 연구했다.

공개된 50국은 중국식 규칙에 한 수에 2분씩 생각하도록 세팅하였다. 이는 인간 기준으로 하루 8시간씩 둔다면 한 대국이 끝나는데 1년은 족히 걸렸을 것으로 예측되는 초 장고대국이며, 승패는 백 38승(76%)/흑 12승(24%)로 백의 승률이 크게 높았다.

50판 모두 불계로 끝났지만 계가까지 진행했을 경우 반집 승부가 20판 이상이었을 정도로 미세한 바둑이 많았다. 다만 알파고는 자신이 유리하면 자기 집을 줄여가면서까지 안전한 승리를 도모하는 성향이 있기 때문에[1], 어디서 얼마만큼의 승패가 갈렸는지 알기 위해서는 상당한 연구가 필요할 것으로 예상된다.

3.1. 평가

이를 본 바둑 관계자들이나 팬들은 전부 멘붕했다. 구글이 이세돌과 대결한 즈음 기보(2016년 2월 29일에 둔 세 판)는 중간중간 이해가 안 되는 부분도 있긴 했지만, 그래도 위화감도 없고, 큰 무리없이 감상할 수 있었다. 즉 '인간의 바둑과 그래도 닮은 구석이 많구나' 그런 정도였다.

그런데 커제와의 대국 이후 공개된 알파고 최신기보는, 인간 바둑의 느낌이 전혀 없다. 인간이 즐겨쓰는 익숙한 포석이나 정석은 거의 보이지 않는다. 비유하자면 피카소가 처음에는 사실주의 그림을 그리다 어느 순간부터 갑자기 입체파로 돌변한 모습과 근접할지도 모른다.

기보를 본 사람들 가운데는 '알파고가 커제를 석 점에 이길 수 있다. 넉 점도 예측 불가다.'[2]는 말까지 나오고 있고[3] 이세돌 기사의 해설마냥 이번에 중국에서 둔 건 아마도 인간의 실력이 약해 봐주면서 둬준 느낌이 아니냐는 소리도 나오고 있다. 알파고끼리 둔 바둑은 죄다 싸움 바둑이고 매우 치열했으며 인간과 둔 것처럼 수비적이지 않았고, 그 전투의 수준이 이해하지 못할 것 같은 경지에 도달했기 때문이다. 지금까지 인간이 만든 바둑의 포석은 3선과 4선의 지상에서 깔리는 반면에 알파고는 우주에서 놀고 있으며 인간이 만든 행마는 알파고에 비하면 너무 소극적이고 답답했다. 즉, 알파고는 인간의 기보를 바탕으로 학습했지만 불과 2년만에 인간의 기보없이 자기 학습으로 바둑의 새로운 영역을 만들어 낸 것이다.
링크

이러한 차이점은 알파고와 인간의 바둑의 학습방식이 아예 다르다는 점에서 기인한다. 인간의 바둑은 귀에 놓은 포석의 분위기나 이렇게 두는 것이 좋겠다는 '느낌', '감각'으로 발달되어왔다. 인간은 알파고처럼 단숨에 모든 전장을 스캔하여 확률 계산을 할 수 있는 능력이 없기 때문에 직관과 반복학습으로 축적된 '패턴'에 의존했고 그에 따라 바둑의 전략도 인간의 방식으로 발전하였다.

이 과정에서 인간의 바둑은 (바둑의 완전체는 아닌) 스승의 권위나 장기간의 연구로 인해 생긴 고정관념에 의해 문제점들이 고착화되기 시작했다. 모든 기사가 이러한 고정관념에 있었기 때문에 인간끼리의 바둑에서는 약점이 드러나지 않았지만 알파고는 모든 확률을 단숨에 계산할 수 있으므로 굳이 인간이 만들어온 전략을 사용할 필요가 없었고 가장 최적의 수를 사용한다. 이 대국들에서 알파고는 빵따냄, 밭전자 째기, 두점머리 맞기, 미니중국식 붙임과 같은 인간에게 금기시 되었던 수많은 전략을 사용하며, '죽음의 선'이라 불리던 2선을 다섯 번 넘게 기어 승리하기도 한다.

이후 바둑 방송이나 잡지에서 알파고 기보들에 대한 분석이 진행되고 있는데, 프로 기사들이 꺼리는 행마, 심지어는 하수들을 지도할 때 하지 말라고 가르치거나 스승에게 꾸중을 들었던 수의 패턴까지도 보여서 분석해 보니 '이러이러한 조건과 경우에서' 말이 되는 등 기존의 패러다임을 박살내는 기보가 수두룩하다. 알파고가 하도 자주 써서 사람들을 의아하게 만들었던 일명 '묻지마 3·三'의 재발견이라든가.

이들 상당수가 수풀이나 정석에서 특정 영역을 보고 '이 부분에서는 이러한 수가 가장 좋다' 라고 생각하던 것을 파괴하고 시야를 넓혀 판 전체를 보니 다른 부분에서의 형세 및 순서에 따라, 상대방의 대응에 따라 기존의 통념과 다른 최선의 수가 나타난다. '사람은 전체적인 맛을 알고 직관을 가지고 있어 프로그램된 방법의 수에 의존하는 컴퓨터보다 대세를 잘 읽는다'는 통념을 완전히 뒤집어버린 것.

한국 바둑 국가대표팀의 감독을 역임했던 목진석 九단은 알파고vs알파고의 1국에서 벌어진 대결에서 가장 격렬한 전투였던 열 개의 수에 대해 인간이 이렇게 두긴 불가능하지 않을까라는 의견을 밝혔다. 여기서 백의 알파고가 좌상귀에 둔 돌들은 인간이 파악하기엔 불가능한 행마였으나, 국가대표 연구회 기사들이 모여 변화도를 연구해보자 십수 수 뒤의 전투에서 우상귀와 좌상귀에 걸친 핵심적인 맹점을 찌르고 있었다. 백은 전투에서 가장 위험하고 치명적인 급소를 찾아 물어뜯고, 흑의 알파고는 느리고 우직하게 버텨 막아낸다. 또한 이 둘의 집 차이는 겨우 반 집 밖에 나지 않는다. 목진석 九단은 현재 알파고의 행마는 국가대표 연구회 사이에서도 아마도 이렇기 때문에 그렇게 둔 것이 아닐까... 라는 추측 정도밖에 되지 않으며, 이러한 대국들로 알파고가 기존에 존재하던 대부분의 바둑격언을 파기시켰다고 말했다.

3.2. 추가 공개된 대국

홈페이지를 통해 공개된 50국을 제외한 다른 기보들. 대부분 ~~딥마인드 정직원~~ 판후이를 통해 중국 방송에서 공개된 것이다.
55국별 포석 정리 52국, 54국, 55국 해설을 영어로 번역한 기보

51국 링크
52국 링크
53국 링크
54국 링크
55국 링크

4. 알파고 제로의 기보

알파고 제로에 대한 논문을 네이쳐에 공개하면서, 추가로 알파고 제로의 기보를 공개하였다. 알파고 제로가 여러 알파고 버전과 대결한 기보는 여기에서 볼 수 있다. 학습 과정중에 이뤄진 중간평가이기 때문에 모든 대국이 최상의 기력인 것은 아니다. 가장 기력이 높은 대국은 알파고 제로 40블록 버전과 알파고 마스터의 대국이다.

[1] 즉, 집 차이를 벌리기 보다는 승리 확률이 높아지는 선택을 우선한다. [2] 이세돌과 알파고 Lee의 차이를 딥마인드는 ' 접바둑'이라 했다. 대략 정선이나 두 점을 봤다는 것. 그런데, 알파고 마스터는 알파고 Lee를 석 점 치수로 내려놓는다. 인간하고 최소 넉 점 이상은 차이나는 레벨이라고 딱 잘라 말하기는 어렵지만 격차가 크긴 하다. [3] 물론 전문기사들은 그렇게 여기지 않는다.

알파고 vs 알파고

1. 개요

2. 버전 18의 기보

3. 알파고 마스터의 기보

3.1. 평가

3.2. 추가 공개된 대국

4. 알파고 제로의 기보

분류