网站图标

WeiqiOK.com

 
 
 

首页』  『新闻』  『题库』  『布局』  『谱度』  『猜局』  『教程』  『赛事』  『视频』  『自助』  『会员
论坛』  『服务』  『模板』  『定式』  『查谱』  『研究』  『名局』  『棋手』  『资源』  『上传』  『汇款

AlphaGo Zero多恐怖? 自学3天虐李世石版100比0

此新闻(手机节流版)来自【新浪网】,原文地址为:http://sports.sina.com.cn/go/2017-10-19/doc-ifymzqpq2287135.shtml
人机大战时 柯洁面对的就是AlphaGo Zero

  北京时间10月19日凌晨,DeepMind 如约公布了他们最新版AlphaGo论文,文中透露最新版本的AlphaGo Zero,使用纯强化学习,将价值网络和策略网络整合为一个神经网络,3天训练后就以100比0击败了上一版本的AlphaGo,也就是那个4-1战胜李世石的版本。

  今年5月乌镇围棋大赛时,DeepMind CEO哈萨比斯表示,将在今年晚些时候公布战胜了柯洁的那版AlphaGo的技术细节。今天,这个承诺如约兑现,DeepMind将他们最新的内容发表于Nature的一篇论文中,详细介绍了迄今最强大的一版AlphaGo—— AlphaGo Zero。

  AlphaGo Zero完全不依赖于人类数据,仅在条件确定的情况下进行自我对弈训练,也就是通常我们所理解的“左右互搏”。一开始它只是一个初学者,但是随着数据和训练的积累,AlphaGo Zero很快掌握了下棋的技巧。由最开始的关注吃子,逐渐摸索到势与地这些围棋最难判断的技术区域。

  仅仅3天的训练过后,AlphaGo Zero就能以100-0击败第一次人机大战时4-1击败李世石的版本,也就是AlphaGo Lee(V18)。训练21天后,它就已经达到AlphaGo Master的水准。随后的AlphaGo Zero已经远远超过Master的水准,而这样一个恐怖的“怪物”就是柯洁在5月份乌镇所面对的对手。

  (文玄)

声明:新浪网独家稿件,未经授权禁止转载!
标签: 李世石柯洁AlphaGo人工智能

相关阅读:

加载中,请稍候...

推荐阅读

加载中,请稍候...


声明:该新闻的版权归原网站所有,本站仅为方便广大棋友阅读、检索使用。     粤ICP备11025915号
有任何意见和建议,请【联系我们】,工作时间:周一至周六 9:00am - 9:00pm,联系电话:0755-83857813     点击这里给我发消息