围棋大师 DeepMind AI 来打游戏了,第一个被虐的是星际争霸 2 职业玩家

在血洗棋坛之后,AI 又将它的触手伸向了游戏领域。

北京时间的 1 月 25 日凌晨,来自 Alphabet 旗下的 DeepMind 组织了一场线上直播,公开展示他们旗下的《星际争霸2》AI 项目「AlphaStar」的新进展,这其实不是类似电竞比赛一样的简单直播,更像是一场特别的发布会。

请输入图片标题

官方表示,自去年年底 12 月以来,该人工智能程序与高水平人类职业选手先后举行了 11 场比赛,而最终的结果是:1 比 10,人类是 1,惨遭 AI 碾压。与围棋领域的 AlphaGo 类似,AlphaStar 训练首先是模仿学习,训练大量人类比赛对战视频,让 AI 通过观察,尽可能地进行模仿,从而理解游戏基本知识,产生不同的「模型」,内部会用名为「Alpha League」的方法进行筛选,让不同的模型进行循环比赛,就诸多竞技游戏中的「天梯」一样。

请输入图片标题

近年来,《星际争霸2》被认为是最具挑战性的即时战略(RTS)游戏之一,也是有史以来游玩历史最悠久的电子竞技之一,已成为人工智能研究的重大挑战。相比起围棋,《星际争霸2》这种 RTS 游戏会对 AI 提出更高的要求,在围棋的一局中,所有的棋子对于双方都是完整可见的,并且双方会进行十分平和的「回合制战斗」。

而对于《星际争霸》等大多数即时战略来说,受到 战争迷雾 的影响,属于「不完美信息博弈」,这就要求人工智能做出实时反映,探索地图,同时结合游戏中不同的元素进行规划、决策和行动。所以与规则上明确清晰,节奏较为缓慢的围棋,以《星际争霸》为代表的即时战略一直是 AI 研究领域十分感兴趣的课题。

不仅是《星际争霸》,早在 2017 年的 DOTA 2 TI7 上,除了常规的比赛之外,Valve 安排了一场特殊的「人机对战」:一个名为 OpenAI 的人工智能,1V1 对战职业选手 Daniil Ishutin,最终的结果是,人类选手被 AI 碾压,AI 取得了最终的胜利。根据官方的 视频,他们在私底下也曾经邀请过一些职业选手与 OpenAI 过招,可以从他们的反映看出来,这些一开始对 AI 表示轻视的「地表最强选手」,最后也被打了个一塌糊涂。

根据 OpenAI 官方的描述,与游戏中本身的 Bot 不同,他们从来没有为其编写程序,来让它理解 Dota 的规则,取而代之的是,AI 会跟自己对战,在自我教学中获得能力上的提升,而这一切,仅仅花了它两周的时间而已。开发者也确认,他们没有调用任何的 Dota 的 API 来获取诸如对手的位置、离自己的距离等等信息。

请输入图片标题

事后,OpenAI 的创始人之一 Elon Musk 也发推祝贺,称:「OpenAI 在电子竞技领域打败了世界上最好的选手,这要比传统的棋类游戏要有难度的多。」

DeepMind AI 和游戏里的 NPC 究竟有什么不同?

只要你玩过任意类型的游戏,就一定会碰到过叫这种做 NPC(Non-Player Character)的游戏角色,玩家一般会把控制 NPC 行动/交互/动作等等一系列动作背后的因素统称为 AI(人工智能)。然而互联网上诸多的 NPC 犯蠢集锦告诉我们:用于娱乐性质的电子游戏中的 AI 既不 Smart,也不 Intelligence。

「我罩住了你的头,所以你看不到我偷东西」
「我罩住了你的头,所以你看不到我偷东西」

事实上,电子游戏中的 AI 系统,本质上其实是一系列的 if this,then that 的条件语句,最简单的比如《合金装备》系列中,如果看到主角,敌人头上冒出的感叹号「!」并进行攻击。实际的情况可能要比这个复杂的多,会出现 if this and this but not this……这种十分精确的条件,这时候电脑自然要对符合条件的指令进行运算,来让这些 NPC 看起来拥有与人类一样的「智慧」,但它并不会进行任何自我学习。

尽管能够进行自我学习的机器学习在科技领域风头正热,但大多数的游戏作品还是采用了「行为树」(Behaviour Trees)这种技术来进行 AI 交互部分的设计。

虚幻引擎中的行为树系统
虚幻引擎中的行为树系统

简单来说,行为树系统是一种数据结构,开发者可以自行设置触发动作的条件以及执行的顺序,程序本身并不用思考什么,只负责运行就可以,由于结果看起来像是一种合理的行为,在设定的条件足够细致且多的情况下,玩家就会觉得「这个行为十分真实」,好吧,以目前的水平,只能说起码不笨。

Mark Brown 所制作的 Game Maker's Toolkit 中曾经提到,好 AI 让玩家作弊,让玩家知道他在想什么,是可预测的,可与系统交互,对玩家做出反应,有他自己的目标,不仅是敌人还能是朋友。游戏作为一种娱乐产品,NPC 的设计目的自然是让玩家玩起来觉得有趣,在一定时间的理解游戏规则之后,能够服务于整个设计本身,也就是通俗「有趣」。

请输入图片标题

而「AlphaStar」或者「AlphaGo」在与人类对战的过程中,会以出其不意的种种操作为行业带来打法、战术上启发性,不管是对于围棋是《星际争霸》,这也是它与游戏 AI 根本的不同。设计之初的目的性不同,造成了根本上的差异,一个是「通过交互手段娱乐人类」,而另外一个则是「通过与人类的对战,提升现今的 AI 技术水平」。

游戏 AI 的未来在哪?

或许在不久之后,经过自我学习和训练的 AI 将能够在基本所有的竞技性对战游戏里战胜人类,但那并不是游戏 AI 的最终目的。

是的,AI 在游戏上的运用仍待完善,但是已经有国外的工程师利用卷积神经网络在《GTA V》里训练 AI 开车,整个「学习」的过程都被放在了 Twitch 上直播,看起来一次又一次翻车还真有点蠢萌。而早在 2017 年,英特尔、达姆施塔特工业大学等也已经用《GTA V》开始测试自动驾驶的相关算法。(请问你要坐在《GTA V》中经过算法测试自动驾驶汽车吗🙂)

请输入图片标题

另外,EA 旗下的旗下技术研发部门 SEED 也创造了一个能让 AI 自学怎样玩《战地1》项目,尽管经过了大约 300 天的游玩训练,它们仍然无法制定或执行任何战术策略,有时还会围着一个圆绕圈,EA 表示,最终的目的是为玩家提供更强大、更真实的敌人,并帮助游戏开发人员调对游戏进行调试。

重要的是,如何利用 AI 来给玩家提供更好的游戏体验、伴随着 AI 与游戏的进一步融合,我们或许有一天真的会看到完全由自主 AI「自导自演」的游戏剧情,不知道这会让人毛骨悚然,还是震撼无比。

> 下载少数派 客户端、关注 少数派公众号 ,让你的生活更精彩 🎉

> 特惠、好用的硬件产品,尽在 少数派sspai官方店铺 🛒