《我的世界》对于José Hernández-Orallo而言并不陌生,他是一名计算机科学家,正在使用这款游戏进行自己的研究。他在瓦伦西亚理工大学的研究团队设计了一种测试机器智能性能的基准,这种方法的设计灵感来源于他看到自己的孩子在3D虚拟世界中游戏的情形。在《我的世界》中,玩家通常需要通过互动解决问题,而不是射杀怪物。
《我的世界》是一款风靡全球的游戏,现在科研人员们正在使用它来测试人工智能
2014年,微软购买了《我的世界》的所有权,这家科技巨头的研究机构——微软研究院随后在此之上设计了一个用于科研的新版本,让计算机程序和科学家们可以探索和自定义游戏中的3D环境。随后,微软邀请了包括Hernández-Orallo在内的一些外部研究人员下载了这个机器友好版本的《我的世界》。从2015年7月起,微软将其完全开放,现在任何人都可以免费使用它,微软希望以此加快人工智能领域的研究速度。
人工智能在各种游戏中的研究最近变得非常火爆,很多公司正像微软一样在游戏中投入研究力量。12月3日,DeepMind开放了自己的3D虚拟世界程序DeepMind Lab,供所有开发人员下载和自定义使用。这家谷歌下属公司设计的虚拟环境一开始被用于训练自己的人工智能程序。仅仅两天以后,OpenAI发布了一个「元平台」允许人工智能程序在其中与最初为人类玩家设计的十几款3D游戏互动,另外,这个环境还包含了一些网络浏览器与手机app。
这三个工具让研究人员与软件开发者们可以轻松地开展自己的实验,测试程序在遇到前所未见的问题时如何进行解决,同时可以帮助程序在类似真实场景的环境中进行自我训练。「这样的虚拟环境将会为人工智能的发展奠定基础,」西雅图华盛顿大学的机器学习研究者Pedro Domingos说道。
DeepMind Lab,一开始被用于训练谷歌自己的人工智能程序,现在已经向所有开发者开放
Atari算法
人工智能是各种视频游戏的老玩家,但在早期,每个用于通关的算法都是特殊定制的。近年来,人们的研究重点开始转向于使用机器学习让程序自我积累经验。在2015年上半年,DeepMind推出的算法在Atari游戏中拥有了超越人类玩家的水平,算法通过不断试错来获得游戏高分,设计者并没有告诉程序每个游戏的目标是什么。
Atari游戏仅仅是2D世界而已。像《我的世界》这样的「***人称」3D 视频游戏可以让玩家置身于一个充满立体感的环境中,相比前者更接近于真实世界,因此吸引了更多研究者的目光。
在《我的世界》中,玩家可以和虚拟世界中的砖块互动,使用它们盖房子,同时也可以探索路线,和游戏世界中的其他内容展开交互。面向开发者的版本被称为Malmo,允许机器算法像人类玩家一样在游戏中进行探索。Hernández-Orallo 正在使用Malmo 来探究虚拟环境是否可用于创建机器智能的基准。不同算法可以相互竞争,看看哪一个可以将砖块搭建成某个物体的形状,或者比较它们在同一个迷宫中寻路所需的时间,这种测试的涵盖面相比图灵测试——机器智能最有名的测试方式——要广泛的多。
让《我的世界》吸引人工智能学者们的另一个原因是,在游戏中玩家们可以打字互相交流。「这可以帮助专家们研究人工智能在现实世界中与人类互动的情况,」微软研究院的科学家Katja Hofmann 说道,她在英国剑桥领导着开发Malmo 的团队。
目前约有100个研究机构正在使用Malmo 3D 世界,它由微软研究院开发,用于人工智能研究
训练机器人
「虚拟世界的人工智能训练对于机器人的发展大有益处,」Hofmann 说道。「因为虚拟环境的定制成本很低,定制速度和安全性也有保障。虚拟环境也可以让机器人研究者们专注于解决机器人的智能问题——机械的问题有时的确令人分心。」
除了Hernández-Orallo 以外,微软研究院还与不少其他研究机构合作开展了一系列Malmo 项目。Hofmann 认为真实的用户数量不止于此,也许有100家。
Malmo 平台包括Java 版本的模块,以及帮助智能体在 Minecraft 环境中感知和操作的代码。这两个组件可以在 Windows,Linux 或 Mac OS 上运行。
DeepMind Lab 和 Malmo 类似,也允许研究者创建迷宫,让不同算法学习如何寻路,获得奖励。DeepMind 正在尝试将「更自然的元素」(如起伏的地形和植物)整加入到这个虚拟世界中。目前这个3D 环境已经开源,DeepMind 希望在其他研究者的帮助下,这个平台能够更加复杂,从而训练更聪明的训练算法。「通过开源,我们可以让所有人参与进来,不断改进这个项目,」DeepMind 的一位发言人说道。
OpenAI 的元平台,Universe,相比前两个3D 世界则更进一步。通过为同一个人工智能程序提供多种不同类型的环境,这一平台或许可以解决领域内最棘手的问题:如何创建一个可以解决任何新问题的算法。目前的深度神经网络——通过模仿脑细胞和视觉皮质层的结构创建的计算机系统——可以快速学会在3D 迷宫中寻路,但同样一个系统却无法将自己学会的方法用于在其他迷宫中导航。「你仅仅改变一下迷宫的颜色,系统就会迷失其中了,」Hernández-Orallo 说道。「这就是目前***进的技术,令人哭笑不得。」
看来,人工智能的发展还有很长的路要走。目前微软现在正努力让 Malmo 可以在 Universe 中使用。「拥有一个社区平台将使所有人从中受益,」OpenAI 的共同创始人,***技术官 Greg Brockman 说道。