围棋学研网 - 围棋入门|围棋教程|围棋棋谱|围棋新闻

　　北京时间10月19日凌晨，DeepMind 如约公布了他们最新版AlphaGo论文，文中透露最新版本的AlphaGo Zero，使用纯强化学习，将价值网络和策略网络整合为一个神经网络，3天训练后就以100比0击败了上一版本的AlphaGo，也就是那个4-1战胜李世石的版本。

　　今年5月乌镇围棋大赛时，DeepMind CEO哈萨比斯表示，将在今年晚些时候公布战胜了柯洁的那版AlphaGo的技术细节。今天，这个承诺如约兑现，DeepMind将他们最新的内容发表于Nature的一篇论文中，详细介绍了迄今最强大的一版AlphaGo—— AlphaGo Zero。

　　AlphaGo Zero完全不依赖于人类数据，仅在条件确定的情况下进行自我对弈训练，也就是通常我们所理解的“左右互搏”。一开始它只是一个初学者，但是随着数据和训练的积累，AlphaGo Zero很快掌握了下棋的技巧。由最开始的关注吃子，逐渐摸索到势与地这些围棋最难判断的技术区域。

　　仅仅3天的训练过后，AlphaGo Zero就能以100-0击败第一次人机大战时4-1击败李世石的版本，也就是AlphaGo Lee（V18）。训练21天后，它就已经达到AlphaGo Master的水准。随后的AlphaGo Zero已经远远超过Master的水准，而这样一个恐怖的“怪物”就是柯洁在5月份乌镇所面对的对手。

声明：新浪网独家稿件，未经授权禁止转载！

应用中心新浪公益新浪游戏互动活动热点推荐

WeiqiOK.com

AlphaGo Zero多恐怖？自学3天虐李世石版100比0

相关阅读：

聚焦

推荐阅读

WeiqiOK.com

『首页』 『新闻』 『题库』 『布局』 『谱度』 『猜局』 『教程』 『赛事』 『视频』 『自助』 『会员』 『论坛』 『服务』 『模板』 『定式』 『查谱』 『研究』 『名局』 『棋手』 『资源』 『上传』 『汇款』

AlphaGo Zero多恐怖？ 自学3天虐李世石版100比0

相关阅读：

聚焦

推荐阅读

AlphaGo Zero多恐怖？自学3天虐李世石版100比0