기자명 박준영 기자
  • 입력 2019.01.23 17:38

1년 전 프로기사 9단과 비슷한 수준, 지금은 '알파고 리' 넘어서
한게임 바둑'을 통해 쌓은 방대한 바둑 데이터를 기반으로 개발
자가 대국을 한 기보로 학습한 '가치망'과 패턴으로 빠르게 둬

NHN엔터테인먼트는 23일 판교 사옥 플레이뮤지엄에서 '프로기사 TOP5 vs 한돌 빅매치' 기자간담회를 개최했다. (사진=박준영기자)
NHN엔터테인먼트는 23일 판교 사옥 플레이뮤지엄에서 '프로기사 TOP5 vs 한돌 빅매치' 기자간담회를 개최했다. (사진=박준영기자)

[뉴스웍스=박준영 기자] NHN엔터테인먼트의 바둑 인공지능(AI) '한돌(HanDol)'의 기력이 지난 2016년 이세돌 9단과 맞붙은 '알파고 리'의 기력을 넘어섰다.

한돌은 23일 신진서 9단과의 대결에서 승리하며, 한국의 톱 랭커 프로기가 5명과 벌인 대전에서 전승을 기록했다.

NHN엔터테인먼트는 23일 판교 사옥 플레이뮤지엄에서 기자간담회를 개최했다. 현장에는 NHN엔터테인먼트의 박근한 이사와 이창율 팀장, 송은영 팀장, 한돌과의 대국을 앞둔 국내 랭킹 2위 신진서 9단이 참석했다.

지난 2016년 50여명의 인력을 확보한 NHN엔터테인먼트는 기술연구센터를 조직하고 AI 기술을 연구했다.

한돌은 게임 AI 분야 첫 프로젝트다. 한돌은 NHN엔터테인먼트가 1999년부터 서비스 중인 '한게임 바둑'을 통해 쌓은 방대한 바둑 데이터를 기반으로 개발됐다.

박 이사는 "2016년 구글 딥마인드의 '알파고 리'가 이세돌 9단을 이긴 것에 자극받아 개발을 시작했다"며 "현재 바둑 프로기사와의 공개 대국을 통해 기술력을 증명하고 있다"고 말했다.

NHN엔터테인먼트의 송은영(왼쪽부터) 팀장과 박근한 이사, 이창율 팀장이 '한돌'에 대해 발표하고 있다. (사진=박준영기자)
NHN엔터테인먼트의 송은영(왼쪽부터) 팀장과 박근한 이사, 이창율 팀장이 '한돌'에 대해 발표하고 있다. (사진=박준영기자)

초기에는 사람이 둔 기보를 학습해서 다음 수를 예측하는 '정책망'을 사용했으나 출시 시점인 2017년 12월부터는 사람이 둔 기보로 학습한 정책망으로 후보 수를 선택한 후 자가 대국을 한 기보로 학습한 '가치망'과 패턴으로 끝까지 빠르게 둔 '롤아웃'으로 다음 수에 대한 승리 확률을 얻었다.

가치망은 현재 자가대국 후 나온 각 수순을 입력해 대국 결과를 바탕으로 학습한 모델이며 롤아웃은 바둑판에 특정 패턴의 돌이 놓이면 미리 만들어둔 패턴으로 돌을 두는 것을 의미한다. 롤아웃은 '알파고 리'와 커제와 대결한 '알파고 마스터'에서 사용된 기술이다.

최신 버전인 '한돌 V2.1'은 무작위·자가대국으로 만든 기보로부터 학습한 정책망 및 더 정확한 가치망을 사용해 롤아웃 없이 수읽기 알고리즘(MCTS)을 통해 다음 수를 예측한다.

여기에 자가 대국을 통해 생성한 기보를 이용하여 학습하는 과정을 반복하여 지속적으로 성능을 개선하고 있다.

'한돌'과 프로기사 9단, '알파고 리'의 기력 비교. (이미지제공=NHN엔터테인먼트)

'한돌의 아버지'로 불리는 이 팀장은 "한돌은 1년 전 인간 프로기사 9단과 비슷한 수준이었지만 지금은 알파고 리의 수준을 넘어서는 기력을 보이고 있다"며 "구글 딥마인드의 최신 버전인 '알파고 제로'에는 아직 미치지 못한다고 생각하지만 계속 학습하면 따라잡을 것"이라고 말했다.

한돌은 2018년 초반 한게임 바둑 9단 이용자와의 대결 이벤트에서 80.5%의 승률을 기록했으며 프로기사와의 비공식 대국에서 7연승을 올렸다.

한돌은 이날 신진서 9단과의 대국에서 승리하며, 국내 프로기사 TOP5와의 대결에서도 전승을 기록했다. 

대국을 앞둔 신진서 9단은 "지난 박정환 9단과의 경기를 보고 한돌의 바둑이 두텁다고 생각했다. 힘든 승부가 될 것 같지만 좋은 모습을 보이겠다"고 각오를 전하기도 했다.

대국을 앞둔 신진서 9단이 경기 전 각오를 전하고 있다. (사진=박준영기자)
대국을 앞둔 신진서 9단이 경기 전 각오를 전하고 있다. (사진=박준영기자)
저작권자 © 뉴스웍스 무단전재 및 재배포 금지