人工智能进军足球游戏

2019-08-29 中国科学报

  2019年8月,谷歌大脑卡罗尔·库拉奇及其同事共同研发了一款名为“谷歌足球环境研究”(Google Research Football Environment)的足球游戏。

  研究人员能够在这一基于物理原理、可定制、易操作且可无限复制的游戏世界中测试他们的算法。此外,他们还向全世界开放该游戏的源代码,世界各地的研究者都可借着这款游戏开发更好的足球游戏算法。

  实际上,人工智能研究人员面临很多挑战。找到任务,为机器学习算法提出新问题便是其中一种挑战。

  乒乓游戏Pong或打砖块游戏Breakout这样简单的电子游戏对于这类算法来说,有时过于简单,几个小时的训练就能让它们在游戏中取得超人的表现。而像星际争霸这样较复杂的电子游戏又太具挑战性,它是多个玩家参与的即时战略大型网络游戏,需要海量的计算去收集用来训练机器学习系统的数据,而大多数研究人员没有这些资源。

  除此之外,许多网络环境使用的是研究人员无法更改甚至看不见的专有代码,他们无法得知游戏做出重要决策的过程,也无法尝试不同的决策过程。

  因此,许多游戏的模式是完全设定好的,即在给定相同输入的情况下,它们将输出完全相同的结果,由此直接学习算法,击败对手。然而,在现实世界中,应对意外情况是一项重要技能。机器掌握这项技能的唯一方法是在不可预测的环境中训练。但不可预测性又必须是可控的,不可预测因素太少,游戏就会太容易,但太多则会让学习变得太难。

  创造这样的环境相当棘手,但这也体现了足球模拟器的作用。游戏根据物理原理设置,因此具有一定程度的可预测性。但是由于对方球员的战术设定,也产生了许多不可预测的因素,在双方球员实力悬殊的情况下,抢断等等则无法预测。

  因此,库拉奇和同事们建立了自己的模拟器。他们用已经问世的游戏Gameplay Football作为训练基础,机器可以在这款游戏中完成整场足球比赛,包括进球、犯规、角球、点球、越位等等。

  谷歌团队表示,“Gameplay Football对足球比赛进行了3D模拟,玩家要在模拟的场景中控制他们的球员,学习如何在球员之间传球,以及如何突破对手的防守得分。”

  由于进球是一个相对罕见的事件,研究人员对机器的成功标准进行了修改,他们考量的是机器以受控方式,将球移动到对手球门的距离。

  此外,该团队还创建了几个复杂程度不同的标准环境来训练和测试人工智能机器。机器需要完成的任务包括打进一个空门、跑动以及在守门员防守的情况下进球、在3对1的比赛中进球等等。总体上来说,测试是一个跟机器人对手进行的标准比赛,所有常用规则都适用。

  实际上,机器算法可以与其他机器或人类对抗,在对抗中体验不同策略,避免机器只是简单地学习机器对手弱点。库拉奇和他的同事认为, “这是一个具有挑战性的强化学习问题,因为足球需要在短期控制、学习传球等概念和高水平策略之间达成自然平衡。”

  这项有趣的工作可能有助于把机器学习应用在更真实的环境中,但这也可能促使机器学习到人类从未想到过的足球新策略,然而这些策略在真正球赛效果是否和模拟球赛一样好,还须进一步关注。

 

  作者:田瑞颖   

  来源:中国科学报 2019年8月29日   

  http://news.sciencenet.cn/sbhtmlnews/2019/8/349143.shtm 

  版权声明:除非特别注明,本站所载内容来源于互联网、微信公众号等公开渠道,不代表本站观点,仅供参考、交流之目的。转载的稿件版权归原作者或机构所有,如有侵权,请联系删除。   

  电话:(010)86409582   

  邮箱:zhiku@scimall.org.cn