AI 科技评论按:在攻克了围棋以后,人工智能研究者们似乎不约而同地把电子竞技游戏作为了下一个练兵场。这两天 DeepMind 刚刚联合暴雪发布了一系列星际2的开发工具包,便于自己和全球的研究者们开发玩星际2的AI,OpenAI 更是已经取得了一些成果,借着DOTA2国际邀请赛 TI7 的机会,在西雅图钥匙馆正赛现场邀请了职业选手 Dendi 与自己的人工智能一决高下。
赛况惨烈!
Dendi 是世界知名DOTA2职业选手、solo高手,不仅自己的玩法灵动多变,经常出现神级的操作,还曾带领 Navi 战队拿下 TI1冠军和TI2、TI3亚军。
然而这一切在 OpenAI 的 AI 面前都显得无力。三局两胜的比赛,在影魔中路对solo、不允许使用瓶子和魂戒、死两次或者丢一塔为负的规则下,第一局 Dendi 在线上没有占到什么便宜,然后不小心被拿了一血,回到线上以后找机会和 AI 在兵线上近身对拼,结果同归于尽,死亡达到两次输掉第一局。
OpenAI 的 CTO Greg Brockman 和开发工程师 Jakub Pachocki 就在 Dendi 身后观战,输掉第一局以后马上与 Dendi 握手致意,然后在进入第二局之前,三个人一同接受了主持人的短暂采访。
第二局则结束得更快,由于 Dendi 没有挡好小兵,一露头就一直被 AI 压制,接着2级时被 AI 进塔强杀,直接打出GG认输。(完整视频见文末)
秘诀:自我学习,两周出师
主持人在两局比赛之间和结束后采访了 Dendi、Greg Brockman 和 Jakub Pachocki 三人。这个 AI 的10人开发团队也来到了现场观战。
开发工程师 Jakub Pachocki 简单介绍了 AI 的训练过程:“这个AI跟以往的游戏AI不一样,它完全是通过自己跟自己对局学习的。我们没有给它设计任何策略、没有从人类高手的对局中学习,从一开始就是自己和自己对局。虽然玩出来的结果基本是随机的,但是每次都能提高那么一点点,慢慢慢慢就达到了专业级水平。”
这个过程中的表现挺有意思的,根据 Jakub介绍,“它刚开始会在地图上乱跑,不知道怎么回事就死在塔下了,那么很快学会了这样不行以后,就待在家里不出来。接下来会站在地图里一动不动只是看着,然后会攻击一下小兵、推进一下兵线之类的,甚至有时候还能补到兵。”“训练过程中其实没有突然的大突破,就是一点点、一点点地升级。基本的学会以后就也逐渐学会骗对手的操作了。”
OpenAI CTO Greg Brockman的讲解更加令人惊讶:“这个AI从零开始,连续训练了2个星期的时间。训练了一个小时以后就已经可以打过内置的AI了,2周以后就达到了今天我们看到的水平。”“我们构建的是一个通用学习系统,在很多方面仍然受到限制,但是它已经能够打败最强的人类DOTA玩家了。在构建更加通用的系统的过程中,这就是重要的一步,以后它们能够学会真实世界中复杂、混乱的重要任务,比如外科手术。我们OpenAI的目标就是确保这样强大的系统能够为人类做出贡献。”
而且他还表示:“我们计划的下一步是5v5的比赛,明年的TI上就可以让大家看到!”这话说完以后现场观众一片欢呼。
主持人让 Dendi 评价 AI 的表现,他的评价是:“你的任何操作失误都会被AI抓住,毫不犹豫,很厉害!”比赛开始前,看到上台的对手是一台电脑的时候 Dendi 还是一脸诧异的“你在逗我”的表情,在赛后已经变成了不甘心:“从来没有想过会被AI打败。”“感觉它有点像人类,也有点不像。”
游戏表现:神乎其技
如果你觉得 Dendi 输给 AI 是因为他的影魔玩的可能没有屠夫那么好的话,更多职业选手也在早些时候“体验”了这个 AI,而且全都“意外”地输了;EG 战队的 Arteezy 表示自己从 replay 中有所收获,Sumail 直接输了个0:10。
具体到操作上,人类玩家需要有意识做出的卡兵、压制、拉仇恨、运补给等等动作在 AI 身上一应俱全,第一局里 Dendi 惊呼 AI 的影魔身上有个芒果,第二局里 AI 的这个卡兵则直接让全场沸腾了。
下面的假动作和站在兵线上吃药秀走位也显示出了顶级的水平(上方为AI)。
达成这样的表现可一点也不容易。AlphaGo 的比赛中大家都见识到了围棋的复杂多变,但每一步只要在某个位置落子就好;DOTA比赛中的操作则要复杂得多,在基于血量、蓝量、装备、消耗品、buff等方面判断自己的状态以后,如何移动、面向的方向、技能释放地点、真动作还是假动作都需要考量。OpenAI 也放出了下面这个视频逐项讲解了 AI 学到的操作技能。
下一步: TI8的5v5?
在搞定了影魔 solo 比赛以后,OpenAI 的下一步打算是让 AI 玩起 5v5 的比赛,并在明年的 TI8 上和职业战队过招。不过也已经有DOTA2玩家在钦佩 solo AI 之后表达了对 5v5 AI 的担心,毕竟在 solo 的基础之上,多人团队比赛中还有 BAN/PICK、分路、接技能、吸引火力、大后期、买活、强拆等等策略性极强、对团队配合要求极高的因素。每届 TI 中都有职业玩家做出精彩的配合令观者拍案叫绝,AI 能否具有这样的创造力(“灵性”)也让人捏了把汗。
不过,该来的总是要来的,职业选手们已经表示希望经常和 solo 中这样厉害的 AI 过招了。雷锋网(公众号:雷锋网) AI 科技评论也会密切关注 OpenAI 的 DOTA2 AI 动向,祝 Open AI 好运、为中国 DOTA 加油。
Dendi 与 AI 影魔 solo 完整视频如下: