手机版
手机版二维码 手机扫描二维码
当前位置:首页国际最强AlphaGo Zero 智慧达「外星级

最强AlphaGo Zero 智慧达「外星级

2017-10-20 来源: 编辑:admin
浏览 0 评论
棋评人去年三月在首尔讲解AlphaGo与南韩棋手李世石对弈的棋局。 

  Google旗下的人工智能软件AlphaGo,在世界瞩目的人机大战中横扫全球围棋高手,但AlphaGo的进化版AlphaGo Zero更让人惊讶,它能在没有输入任何人类经验的情况下,迅速採取跟自己反覆对弈的自学方法,仅训练三天便以100:0的战绩完胜二〇一六年版的AlphaGo,四十天后,又战胜了曾击败人类第一棋手柯洁的一七年版AlphaGo。新版本标誌着人工智能取得巨大突破,被形容为「外星智慧」。

  科网巨擘Google旗下英国深度思维(DeepMind)公司的团队,在新一期《自然》期刊发表《在没有人类知识条件下掌握围棋游戏》的论文,介绍了AlphaGo Zero。

  该公司将AlphaGo的发展分为四个阶段:第一个版本是AlphaGo Fan,它在二〇一五年战胜欧洲围棋冠军樊麾,标誌着人工智能首次战胜人类职业棋手;第二个版本是AlphaGo Lee,它在二〇一六年战胜曾多次夺得世界冠军的南韩棋手李世石,标誌人工智能战胜人类顶级棋手;第三个版本是AlphaGo Master,在今年战胜现今世界排名第一的中国棋手柯洁,并在与多位有世界冠军头衔的人类棋手「群战」中完胜。

  但是,这些版本在刚开始学习围棋时,都要依靠人类知识,即先教它们一些人类摸索出的基本下法,然后再开始自己学习。AlphaGo Lee在参考大量人类棋谱并自我对弈约三千万盘、训练数月后,才于去年三月以四比一的战绩击败南韩九段棋手李世石。

  然而AlphaGo Zero摆脱了这个限制,从空白状态学起,研究人员没有给它除棋盘、棋子、规则之外的任何人类输入,「从零开始」迅速自学围棋,反复自己与自己对弈取得飞速进步,掌握获胜可能性高的下法,专攻「强化学习」是其主要特点。它在开始学习围棋三天,进行了约五百万局自我对弈后,就以一百比零完胜AlphaGo Lee;四十天后,它又战胜了在所有人类高手看来已不可企及的AlphaGo Master。

  领导AlphaGo团队的西尔弗表示,AlphaGo Zero使用新的强化学习方法,系统从只知道围棋的规则开始,透过神经网络的运算自我对弈自学。该论文指出,AlphaGo Zero完全自学,「不需人类输入」,是机器获得超人能力的重要一步。

  麻省理工学院电脑科学家海因斯惊歎道:「AlphaGo Zero就像外星人在发明自己的数学。它没有人类的偏见和推测,学习自己认为最好的东西,误差比人类少。」

  论文指出,在数百万局自我对弈及训练后,AlphaGo Zero独立发现了人类花数千年才总结出的围棋规则,还建立了新战略,为这个古老的游戏带来新见解。世界顶尖棋手的养成,动辄需要数十年的训练、磨砺,但AlphaGo Zero创下只需三天的纪录。

  上海纽约大学电脑科学教授张峥表示,从算法来说,AlphaGo Zero比它的「前辈」更简洁、漂亮。它摆脱了人为的大数据,在人类所定的规则下,自主发现新知识,并纠正人类的错误知识。柯洁在微博发文感歎:「一个纯净,纯粹自我学习的Alphago是最强的……人类太多余了。」深度思维行政总裁哈萨比斯说,他希望人工智能的这种进步能够被应用于分析蛋白质结构、设计新材料等领域。

相关阅读
意见反馈
返回顶部