“阿法星”在“星际争霸”中比肩顶尖人类玩家

2019-10-31 科技日报

    著名的人工智能公司英国“深度思维”(DeepMind)最新推出了一款主体增强学习算法“阿法星”(AlphaStar)。目前,这款人工智能程序已进入战略游戏《星际争霸II》前0.2%排名的人类玩家之列。根据英国《自然》杂志30日发表的一篇论文,该算法代表了机器学习的一大重要成就,经过改造,将有助于解决其他应用领域的复杂问题。 

  《星际争霸II》游戏已经成为人工智能研究领域的一项巨大挑战。据介绍,这是一款科幻主题的策略游戏,有全球性的专业比赛,也是全球最赚钱的专业电子竞技之一。该游戏中有三个特征和能力截然不同的种族,玩家控制其中一个种族,相互对抗。

  而在之前的比赛中,即使简化了游戏规则,人工编制特定动作序列或依赖超人类的功能(如每分钟执行上万次动作),人工智能体也无法与顶尖人类玩家抗衡。

  此次,“深度思维”公司奥里奥·维亚尔斯及同事,展现了最新的多主体增强学习算法——“阿法星”。在该算法中,若干深度神经网络主体相互竞争,生成大量的持续适应性策略和对策。之后,“阿法星”在一系列在线游戏中与人类玩家比赛,无论玩《星际争霸II》的哪一个种族,“阿法星”都达到了大师级水平。这标志着人工智能体首次在没有简化游戏的情况下,在专业电子竞技中达到了顶尖人类玩家的水平。

  “深度思维”公司2016年凭借“阿法狗”程序与人类围棋世界冠军之战大获全胜而成名;其后该程序升级为“阿法元”(AlphaGo Zero),能够从空白状态起,不需要任何人类棋谱输入的条件下自学围棋;下一代“阿法零”(AlphaZero)则接连击败了国际象棋、将棋、围棋三个世界冠军级的电脑程序,成了全能棋王。随后,公司宣布这一程序不再主攻棋法,而是“投身”医疗、能源以及新材料等领域。

  总编辑圈点

  在AI领域,“阿法狗”是个嚣张的名字,该程序妙手迭出,刷新了不少世界纪录。但再厉害的AI算法,最终仍要落地于应用。“深度思维”早已宣布将重心从人机大战中抽出来,转而投向能“提供疾病治疗方案”的AI、能“降低能源消耗”的AI、能“发明出革命性新材料”的AI……因此,笑傲一个曾被认为AI很难战胜人类的游戏,也必然不是“阿法星”的诉求,那只是它甫出茅庐、抓住你眼球的方式罢了,这个多主体增强算法,未来所施展的才华必将超过它的前辈。

 

  作者:张梦然 

  来源:科技日报 20191031日   

  http://digitalpaper.stdaily.com/http_www.kjrb.com/kjrb/html/2019-10/31/content_433822.htm?div=-1

  版权声明:除非特别注明,本站所载内容来源于互联网、微信公众号等公开渠道,不代表本站观点,仅供参考、交流之目的。转载的稿件版权归原作者或机构所有,如有侵权,请联系删除。  

  电话:(01086409582  

  邮箱:zhiku@scimall.org.cn