阿尔法狗围棋教学工具上线,自学三天赢

阿尔法狗围棋教学工具上线 围棋世界冠军的朋友圈“炸开锅”

姓名:李海洋              学号:16180210040

12月11日晚,欧洲围棋冠军、AlphaGo开发团队成员樊麾在社交媒体上透露,AlphaGo的教学工具正式上线。

转载自:tech.sina.com.cn/it/2017-10-20/doc-ifymzzpv7087418.shtml有删节。

不过,和人们想象中有些不同的是,目前公布的AlphaGo教学工具还只有关于围棋开局方面的内容。

部分资料来自baike.baidu.com/item/阿尔法围棋/19319610有删节。

该教学工具是一个简单的网页,据称收录了6000个开局变化,每个开局变化延续到20多步棋为止。

【嵌牛导读】:近年来AI行业得到了越来越多的关注,大家还记得之前的AlphaGo吗?最近它再次出现在了了人们的视野中。人工智能AlphaGo又以一种新的方式超越了自己----从零开始自学,三天战胜“前辈”。

而每一步棋,使用者都可以看到该局面下人类棋手可能下出的着法,以及AlphaGo所选择的下法,同时也能看AlphaGo对每一种下法所做出的胜率评估。

【嵌牛鼻子】:人工智能、深度学习、围棋

皇家赌场网址hj9292 1

【嵌牛提问】:AlphaGo的历史由来?它的发展版本历史?阿尔法狗-零如何学习?AlphaGo Zero牛在哪里?

皇家赌场网址hj9292 2

【嵌牛正文】皇家赌场网址hj9292,:

据该教学工具网站介绍,目前工具中收录的6000个开局变化来自于超过23万盘人类棋手的对局,以及75盘AlphaGo与人类棋手的对局。

AlphaGo的历史由来?

很快,这一消息就在棋手中间引发了讨论。柯洁在微博直接写道:“重新学围棋。”

       阿尔法围棋(AlphaGo)是第一个击败人类职业围棋选手、第一个战胜围棋世界冠军的人工智能程序,由谷歌(Google)旗下DeepMind公司戴密斯·哈萨比斯领衔的团队开发。其主要工作原理是“深度学习”。

围棋世界冠军常昊九段则表示,“教学工具不一定是标准答案,更多的是给予了我们无限的思考空间。”

       2016年3月,阿尔法围棋与围棋世界冠军、职业九段棋手李世石进行围棋人机大战,以4比1的总比分获胜;2016年末2017年初,该程序在中国棋类网站上以“大师”(Master)为注册帐号与中日韩数十位围棋高手进行快棋对决,连续60局无一败绩;2017年5月,在中国乌镇围棋峰会上,它与排名世界第一的世界围棋冠军柯洁对战,以3比0的总比分获胜。围棋界公认阿尔法围棋的棋力已经超过人类职业围棋顶尖水平,在GoRatings网站公布的世界职业围棋排名中,其等级分曾超过排名人类第一的棋手柯洁。

中国棋坛传奇名宿江铸久的评论更加简洁:“幸福的时代”。

它的发展版本历史?

皇家赌场网址hj9292 3

        DeepMind公司将“阿尔法围棋”的发展分为四个阶段:第一个版本是“阿尔法围棋-樊”,它在2015年战胜欧洲围棋冠军樊麾,标志着人工智能首次战胜人类职业棋手;第二个版本是“阿尔法围棋-李”,它在2016年战胜曾多次夺得世界冠军的韩国棋手李世石,标志着人工智能战胜人类顶级棋手;第三个版本是“阿尔法围棋-大师”,在今年战胜现在世界排名第一的柯洁,并在与多位有世界冠军头衔的人类棋手“群战”中完胜。2017年10月18日,DeepMind团队公布了最强版AlphaGo ,代号AlphaGo Zero

柯洁微博表示,要重新学棋。

阿尔法狗-零如何学习?

此前,关于AlphaGo推出围棋教学工具一事,“棋圣”聂卫平也给出过自己的解读。

        DeepMind团队发表的论文提到,“阿尔法围棋-零”最大突破在于,实现“白板理论”。白板理论认为,婴儿是一块白板,可以通过后天学习和训练来提高智力。人工智能(AI)的先驱图灵认为,只要能用机器制造一个类似于小孩的AI,然后加以训练,就能得到一个近似甚至超越人类智力的AI。与经过亿万年演化的生物体相比,计算机是真正的“白板一块”。自学成才的“阿尔法围棋-零”正是实现了这一理论。

“之前我有种错觉,认为人工智能不可能下得过职业棋手。但从它与李世石下的5盘到与世界高手下的60盘,彻底扭转了我对人工智能的印象。AlphaGo教棋,对围棋是好事。”

        论文中提到,“阿尔法围棋-零”是无监督学习的产物(机器自己摸索、发现规律),而它的双胞胎兄弟“阿尔法围棋-大师”则用了监督学习的方法(人把经验教给机器)。40天后,前者以89:11的成绩战胜后者。除学习原理外,新版本“阿尔法围棋-零”使用了单一的神经网络。此前版本的“阿尔法围棋”都用了两种神经网络:一种用来预测下一步棋最好的走法,另一种用来计算,根据这些走法谁更有可能获胜。“阿尔法围棋-零”则只让神经网络预测获胜者,从而能够得到更高效的训练和评估。它也不再使用快速而随机的走子方法,而是通过高质量的神经网络来评估棋局。它和不同版本的自己下棋,然后用胜者思路来训练新的版本,如此不断重复。通过这一方法,“阿尔法围棋-零”完全摸索出开局、收官、定式等以前人类已知的围棋知识,也摸索出新的定式。

“AlphaGo战胜职业棋手,产生了巨大的影响,现在它支持业余、少年围棋的普及,我是非常感谢的。”

AlphaGo Zero牛在哪里?

皇家赌场网址hj9292 4

       上面年那些版本在刚开始学习围棋时,都要依靠人类知识,即先教它们一些人类摸索出的基本下,然后再开始自己学习。AlphaGo Zero摆脱了这个限制,研究人员没有给它除棋盘和棋子外的任何输入,它完全是“从零开始”,自己与自己对弈,通过更为优秀的算法,取得飞速进步。开始学习围棋3天后,“阿尔法围棋-零”就以100比0的成绩战胜“阿尔法围棋-李”;40天后,它又战胜了在所有人类高手看来已不可企及的“阿尔法围棋-大师”。

柯洁负于AlphaGo后落泪。

在接连战胜人类顶尖高手之后,AlphaGo的野心还没有结束。

今年10月,AlphaGo开发团队在《自然》杂志上发表论文,公布了AlphaGo升级版——AlphaGo Zero的问世。

和此前各个版本的AlphaGo不同,阿尔法元在学习围棋的过程中没有使用人类的棋局作为“教材”,而是完全自我学习,在自我对弈中实现棋艺的提升。

据其开发团队透露,阿尔法元在完全从零开始,不借鉴任何人类经验的情况下,仅仅自我对弈训练了3天,下了490万盘棋,就达到了极高的水准,以100比0的比分战胜了此前击败李世石的AlphaGo版本。

而在训练40天后,就以89比11的比分战胜了击败柯洁的AlphaGo版本。

特别声明:本文转载仅仅是出于传播信息的需要,并不意味着代表本网站观点或证实其内容的真实性;如其他媒体、网站或个人从本网站转载使用,须保留本网站注明的“来源”,并自负版权等法律责任;作者如果不希望被转载或者联系转载稿费等事宜,请与我们接洽。

本文由皇家赌场网址hj9292发布于皇家赌场网址,转载请注明出处:阿尔法狗围棋教学工具上线,自学三天赢

您可能还会对下面的文章感兴趣: