看家乡事,品故乡情


“阿尔法围棋”只有自己能胜自己仅用三天击败前辈版本“从零开始”取得飞速进步

兰州日报 2017-10-20 09:17 大字

【据新华社伦敦10月18日电】人工智能“阿尔法围棋”在几次世界瞩目的人机大战后站在了围棋之巅,现在它又以一种新的方式超越了自己:新版本“从零开始”学习围棋,仅用3天就击败其前辈版本,成为新的王者。

英国“深度思维”公司开发出了“阿尔法围棋”,该公司团队在新一期英国《自然》杂志上发表题为《在没有人类知识条件下掌握围棋游戏》的论文,介绍了最新版的“阿尔法围棋-零”。

该公司将“阿尔法围棋”的发展分为四个阶段:第一个版本是“阿尔法围棋-樊”,它在2015年战胜欧洲围棋冠军樊麾,标志着人工智能首次战胜人类职业棋手;第二个版本是“阿尔法围棋-李”,它在2016年战胜曾多次夺得世界冠军的韩国棋手李世石,标志着人工智能战胜人类顶级棋手;第三个版本是“阿尔法围棋-大师”,在今年战胜现在世界排名第一的柯洁,并在与多位有世界冠军头衔的人类棋手“群战”中完胜。

但是,这些版本在刚开始学习围棋时,都要依靠人类知识,即先教它们一些人类摸索出的基本下法,然后再开始自己学习。第四个版本,即最新的“阿尔法围棋-零”摆脱了这个限制,研究人员没有给它除棋盘和棋子之外的任何输入,它完全是“从零开始”,自己与自己对弈,通过更为优秀的算法,取得飞速进步。

开始学习围棋3天后,“阿尔法围棋-零”就以100比0的成绩战胜了“阿尔法围棋-李”;40天后,它又战胜了在所有人类高手看来已不可企及的“阿尔法围棋-大师”。

研究人员认为,从需要预先输入人类知识,到能完全依靠自己摸索,“阿尔法围棋”的进步标志着人工智能的巨大突破,因为这意味着人工智能可以更好地进入对它来说本是一片空白的领域。

新闻推荐

英情报官员称 英国面临 恐怖主义巨大挑战

新华社伦敦10月17日电英国情报部门军情五处主管安德鲁·帕克17日警告,英国正面临恐怖主义威胁的巨大挑战,目前开展反恐行动的频次是他入职34年以来最高的。帕克在接受英国广播公司采访时说,在过去4...

 
相关新闻