WeiqiOK.com


『首页』　『新闻』　『题库』　『布局』　『谱度』　『猜局』　『教程』　『赛事』　『视频』　『自助』　『会员』『论坛』　『服务』　『模板』　『定式』　『查谱』　『研究』　『名局』　『棋手』　『资源』　『上传』　『汇款』

围棋AI ELF OpenGo全面开源田渊栋揭秘训练过程

此新闻（手机节流版）来自【新浪网】，版权归【新浪网】所有，原文地址为：
http://sports.sina.com.cn/go/2019-02-14/doc-ihrfqzka5784014.shtml

本站旨在帮助棋友通过网站（手机）了解业内资讯。如涉侵权，敬请告之，我们将在第一时间删除。

资料图

　　来源：量子位

　　现在，随时、随地、随心情，你都能和国际顶级围棋AI对战交流一局了。

　　最近，Facebook的围棋AI ELF OpenGo全面开源，下载ELF OpenGo最终版本模型，人人都能与ELF OpenGo下棋。

　　对了，不要被ELF OpenGo“超能力”般的棋艺惊叹到，不仅是你，连韩国棋院的专业围棋选手也被打败了。在与金志锡，申真谞，朴永训及崔哲瀚四位专业棋手对战时，ELF OpenGo以20：0的成绩大赢特赢。

　　甚至围棋AI界小有名气的前辈Leela Zero，也以18：980的成绩被ELF OpenGo远远甩在身后。

　　今天，Facebook公布了ELF OpenGo的研究论文，复现了AlphaGo Zero和AlphaZero开源地址。

　　15天，15天

　　在今天刚发布的论文ELF OpenGo： An Analysis and Open Reimplementation of AlphaZero中，Facebook研究人员全面披露了ELF OpenGo的训练过程。

　　ELF OpenGo是去年诞生的。当时，Facebook改进了自己面向游戏的机器学习框架ELF，在上面重新实现了DeepMind的AlphaGoZero及AlphaZero的算法，得到了这个围棋AI ELF OpenGo。

　　论文显示，训练过程大部分遵循了AlphaZero的训练过程。

　　和AlphaZero用5000个自我对弈的TPU和64个训练TPU不同，整个训练过程共用了2000块英伟达GPU，型号均为英伟达Tesla V100 GPU，内存为16GB，总共训练了15天。

　　研究人员还应用了ELF OpenGo，完成了另外三方面突破

　　一方面

　　研究人员开发了一个类似AlphaZero的软件，在上面用2000块GPU连续训练了9天后，这个20个区块的模型的表现已经超过了人类水平。

　　随后，研究人员提供了一些预训练模型、代码和2000万局自我对弈的训练轨迹数据集进行训练。

　　第二方面

　　第三方面

　　研究人员发现，对于最终模型而言，对局中加倍rollout水平大约提升200 ELO，AI的发挥会受到模型容量的限制。

　　目前，ELF OpenGo的论文、模型、实现代码、自我对弈数据集和与人类对弈记录等已经全部开放，地址可到文末寻找。

　　明星团队

　　这篇论文来自Facebook人工智能研究所（FAIR），一作国内机器学习圈里一个熟悉的名字，田渊栋。

　　田渊栋从卡内基梅隆大学（CMU）毕业后，田渊栋奔赴谷歌无人车项目组，随后跳槽转向Facebook人工智能研究所。Facebook围棋AI Darkforest的相关研究，负责人和论文一作也是田渊栋。

　　△ 田渊栋本人

　　田渊栋也一直活跃在知乎，是人工智能、深度学习话题的优秀回答者，是知乎er心中的大神。

　　去年，田渊栋回顾自己近几年的工作感悟和学习生涯的文章《博士五年之后五年的总结》，曾成为圈内的爆款文章，不少网友再次被圈粉，大呼醍醐灌顶。

　　论文二作Jerry Ma也同样为华裔，其Facebook介绍显示，2018年，Jerry Ma刚刚本课毕业，获得哈佛大学经济学和古典文学学士双学位。目前担任Facebook研究工程负责人。

　　△ Jerry Ma

　　年纪不大，责任不小。

　　传送门

　　GitHub地址：https：//github.com/pytorch/ELF

　　论文地址：https：//arxiv.org/abs/1902.04522v1

　　Facebook博客介绍：https：//ai.facebook.com/blog/open-sourcing-new-elf-opengo-bot-and-go-research/

　　ELF OpenGo官网：https：//facebook.ai/developers/tools/elf-opengo

　　另外，如果你自带Windows系统的电脑，还可以下载这个软件，在线下棋。下载地址：

　　https：//dl.fbaipublicfiles.com/elfopengo/play/play_opengo_v2.zip

　　— 完 —

声明：该新闻的版权归原网站所有，本站仅为方便广大棋友阅读、检索使用。粤ICP备11025915号
有任何意见和建议，请【联系我们】，工作时间：周一至周六 9:00am - 9:00pm，联系电话：0755-83857813