游戏史经典名作四十年后再度重生!NVIDIA研究人员使用AI再现初代《吃豆人》,GameGAN是一个生成式对抗网络,其使用《吃豆人》进行了5万个回合训练,无需基础游戏引擎就能生成这款经典游戏的完整版。
【慧聪通信网】四十年前,《吃豆人》首次出现在日本的游戏厅中。如今,这款被列入世界游戏名作殿堂的经典游戏借助于AI技术再度重生。
经过5万个回合的游戏训练,由NVIDIA研究院创建的强大新AI模型NVIDIA GameGAN,能够在无需基础游戏引擎的情况下生成完整版的《吃豆人》游戏。也就是说,该AI即使不了解游戏的基本规则,也可以完美再现这款经典游戏。
GameGAN是首个利用生成式对抗网络(GAN)模仿计算机游戏引擎的神经网络模型。GAN模型由两个相互对抗的神经网络组成,一个生成器(generator)和一个鉴别器(discriminator),其能够学习创建足以媲美原版内容的新内容。
NVIDIA研究人员兼该项目的首席作者Seung-WookKim表示:“这是首个使用GAN神经网络模拟游戏引擎的研究。我们想看看AI是否可以仅通过观看游戏中智能代理的行为来学习领悟游戏环境规则。事实证明它做到了。”
当智能代理试玩GAN生成的游戏时,GameGAN会对代理的行为做出响应,从而实时生成新的游戏环境框架。在使用游戏不同等级或版本的游戏剧本进行训练后,GameGAN甚至可以生成从未有过的游戏关卡。
游戏开发人员可以利用此功能自动生成新的游戏等级关卡,AI研究人员则可以使用此功能更轻松地开发用于训练自主机器的模拟器系统。
游戏发行商万代南梦宫娱乐(BANDAI NAMCO Entertainment)旗下研发公司万代南梦宫研究有限公司(BANDAI NAMCO Research Inc.)提供了此次用于训练GameGAN所用的《吃豆人》数据。该公司的Koichiro Tsutsumi表示:“在看到这个结果时,我们都感到震惊,大家都无法相信可以在没有游戏引擎的情况下再现了南梦宫的经典游戏《吃豆人》。这项研究将帮助游戏开发人员加快新关卡、角色甚至游戏的开发。一想到这一点,我们就感到十分兴奋。”
NVIDIA将于今年晚些时候在AI Playground上发布这款由AI再现的《吃豆人》。届时,所有人都可以亲身体验此研究演示。
AI再现经典之作
《吃豆人》是游戏史的经典之作,过去在游戏厅里经常可以看到,伴随着经典的游戏背景音乐,《吃豆人》的爱好者们控制着吃豆人,在这款经典之作的迷宫中追逐吃豆躲避鬼魂。
仅在1981年,美国人就往游戏机里投了几十亿个25美分硬币,玩《吃豆人》等投币游戏,总游玩时间达到75000小时。在之后的几十年中,这款热门游戏不断推陈出新,在电脑、游戏机和手机上推出了多个版本。
GameGAN版本依靠神经网络而非传统的游戏引擎来生成《吃豆人》环境。AI持续追踪这个虚拟世界,记录已生成的内容以保证帧与帧之间的视觉一致性。
无论是哪一款游戏,GAN都可以通过从过去的游戏中提取屏幕录像和智能代理的按键轨迹来学习其规则。游戏开发人员可以将原关卡中的游戏剧本作为训练数据,使用该工具为当前的游戏设计新的等级关卡。
利用万代南梦宫研究有限公司所提供的数据,Kim和他在多伦多NVIDIAAI研究院的同事们一起在NVIDIA DGX系统上使用《吃豆人》游戏对该神经网络进行了总计数万帧的训练,同时加入了AI代理在游玩这款游戏时的键盘轨迹。
经过训练后的GameGAN模型能够生成静态环境元素,例如统一的迷宫形状、豆子和强化道具,以及作为敌人的幽灵和吃豆人本身等移动元素。
该模型能够学习简单和复杂的关键性游戏规则。例如,和原版游戏一样,吃豆人无法穿过迷宫墙。他需要一边四处移动,一边吃豆。当他吃到强化道具后,鬼魂会变成蓝色并四处逃窜。当吃豆人从一侧离开迷宫时,他会被传送到迷宫的另一侧。一旦吃豆人碰到鬼魂,屏幕就会闪烁并结束游戏。
由于该模型可以区分背景与活动的角色,因此其可以将游戏中的迷宫替换成绿篱墙式的迷宫,还可以将吃豆人换成你最喜欢的表情符号。开发人员可以使用这项功能尝试新的角色创意或游戏主题。
不仅仅适用于游戏
自主机器人通常也需要在模拟器中接受训练,模拟器中的AI可以在与现实世界中的目标进行交互之前,学习环境规则。对于开发人员而言,创建模拟器是一个相当耗时的过程。开发人员必须编写有关如何与目标互动,以及光在环境中如何表现等规则。
模拟器被广泛用于开发各种自主机器,例如学习如何抓握和移动物体的仓库机器人、或是需要在人行道上运输食物或药品的物流机器人等。
而GameGAN的出现,为其带来了一种可能性——在未来的某一天,神经网络训练将能取代此类任务中编写模拟器的工作。
比如你在汽车上安装一个摄像头。该摄像头可以记录道路环境或驾驶员的行为,例如转动方向盘或踩下油门等。这些数据可被用于训练一个深度学习模型,其能够预测在现实世界中,人类驾驶员(或自动驾驶汽车)在做出猛踩刹车等动作时会发生什么后果。
NVIDIA多伦多研究实验室主任Sanja Fidler表示:“我们最终将训练出一个AI,其只需通过观看视频和观察目标在环境中所采取的行动,就能模仿驾驶规则或物理定律。GameGAN是朝这一目标所迈出的第一步。”
NVIDIA研究院在全球拥有200多名科学家,主要关注于AI、计算机视觉、自动驾驶汽车、机器人技术和图形等领域的研究。
GameGAN由Fidler、Kim、NVIDIA研究员Jonah Philion、多伦多大学(University of Toronto)学生Yuyu Zhou和麻省理工学院(MIT)教授Antonio Torralba共同创作。该论文将在6月举行的著名国际计算机视觉与模式识别会议上发表。
责任编辑:李成磊