看家乡事,品故乡情


无师自通自学三天成才 与“旧狗”对弈100局未尝败绩 最新版的“阿尔法狗”太恐怖

西安晚报 2017-10-20 08:04 大字

阿尔法狗曾战胜世界第一柯洁东方IC供图

当人工智能程序AlphaGo(阿尔法狗)横扫人类棋手时,大多数人虽因“人类最后的智慧高地”失守而惋惜,但也认为AlphaGo是大量学习了人类棋谱才得以“独孤求败”。然而,随着昨日最新版AlphaGo论文的公布,这一论断也将被改写。据该论文介绍,最新版的“阿尔法狗”是在无任何人类输入的情况下自学围棋的,并最终达到了碾轧“旧狗”的高度。

“新狗”只学了40天时间

就赢了碾轧众人的“大师”

2015年,当谷歌团队对外宣布人工智能战胜了欧洲围棋冠军樊麾后,AlphaGo(阿尔法狗)也首次进入公众视野。不过在当时,大家一致认为“阿尔法狗”的水平仅限于战胜樊麾等一般棋手,而不可能战胜顶尖棋手。然而,“阿尔法狗”随后不仅战胜了李世石,今年又在与人类棋手的终极对决中3∶0战胜了柯洁。

据昨日公布的题为《在没有人类知识条件下掌握围棋游戏》的论文介绍,开发公司将“阿尔法狗”的发展分为四个阶段,也就是四个版本,第一个版本即战胜樊麾时的人工智能,第二个版本是去年战胜李世石的“狗”,第三个是在围棋对弈平台名为“Master”(大师)的版本,其在与人类顶尖棋手的较量中取得60胜0负的骄人战绩,而最新版的人工智能开始学习围棋3天后便以100∶0横扫了第二版本的“旧狗”,学习40天后又战胜了在人类高手看来不可企及的第三个版本“大师”。

抛弃人类经验后棋力大长

为围棋规则带来全新见解

在这篇论文中,最颠覆人类观念的是最新版本的“阿尔法狗”,它没有使用任何人类围棋数据,换句话说,它是自学成才,抛弃了人类过往的围棋经验,而正是在此情况下,最新版本的“阿尔法狗”的实力实现了质的飞跃。据开发公司介绍,最新版本的“阿尔法狗”从学习围棋时就没有接触过人类棋谱,而是从空白状态学起,研发团队只是让它自由随意地在棋盘上下棋,然后进行“左右互搏”。

在与第二版“阿尔法狗”的对弈中,“新狗”以100∶0获胜。据介绍,战绩一边倒的同时,计算力的消耗也是一边倒——新版只用了一台机器和4个TPU(专业芯片),而“旧狗”则需多台机器和48个TPU。“新狗”之所以所向披靡,最主要的原因是采用了新的强化学习的算法。随着自我对弈局数的增加,“新狗”独立发现了人类可能用数千年才能总结出来的围棋规律,并带来了全新见解。

打败人类棋手非最终目的

未来希望能改变人类命运

那么,谷歌公司研发“阿尔法狗”,只是为了对付人类棋手吗?实际上,这从来不是“阿尔法狗”的目的,开发公司只是通过围棋来试探它的功力,而研发这一人工智能的最终目的是为了推动社会变革、改变人类命运。

“阿尔法狗”之父哈萨比斯表示:“如果我们通过人工智能可以在蛋白质折叠或设计新材料等问题上取得进展,那么它就有潜力推动人们理解生命,并以积极的方式影响我们的生活。”据悉,目前他们正积极与英国医疗机构和电力能源部门合作,以此提高看病效率和能源效率。本组稿件由记者闫斌采写

柯洁感慨“人类太多余了”

本报讯(记者闫斌)昨日,“阿尔法狗”的最新论文公布后,人类棋手也纷纷发表评论。有幸与之过招的世界等级分第一人柯洁在微博上感慨道:对于AlphaGo的自我进步来讲,人类太多余了。

在今年乌镇举行的人机大战上,柯洁虽然拼尽全力却仍以0∶3告负,三场比赛看似有机会取胜,但事后来看AlphaGo是无解的。当时柯洁也不禁落泪,并称AlphaGo“实在太完美了”。昨日,有关于“阿尔法狗”的最新论文公布,得知详情后柯洁感慨道:一个纯粹自我学习的AlphaGo是最强的,“对于AlphaGo的自我进步来讲,人类太多余了”。唐韦星也发表微博表示:“看了之后不知道说什么,它(AlphaGo)确实不需要我们的知识,之前版本用了好几年,被这个才学了40天的打败似乎就是我们拖后腿了。”

新闻推荐

日本造高铁英国首发就漏水晚点,曾被曝使用神户制钢问题产品

200英镑(约合人民币1755元)票价的日产高铁,首发就漏成了水帘洞,让英国的乘客们叫苦不迭。对“日本制造”的质疑声因“神户钢铁”造假事件一波未平,“高铁漏水”一波又起。日本制造GWR列车。资料图据英...

 
相关新闻