查尔星港独家整理报道,转载请注明出处!
查尔星港前言:在去年暴雪嘉年华期间,暴雪宣布了有关Deepmind人工智能与《星际争霸2》在未来领域关于AI人工智能的发展计划。谷歌研究科学家Oriol Vinyals登台透露,谷歌正在研制新一代的人工智能,将在未来的《星际争霸2》中为玩家、甚至是全人类带来帮助,以及像不久前Alpha Go与人类对弈围棋一样,和人类挑战《星际争霸2》。
而在今天,《星际争霸2》开发团队正式公布了研究的最新进展:《星际争霸2》API(人工智能研究方向)现已推出,研究人员、游戏玩家以及业余爱好者可以共同使用这套由暴雪开发的机器学习框架,来对AI进行研究和训练,并最终加速实时战略游戏AI的研究。此外暴雪也宣布,会挑选出十万份匿名玩家的天梯比赛录像,以此来作为AI模仿训练的数据支撑。
此次举措意味着即使你不是科学家,而只是一个星际2玩家,也可以自己动手来构建任务与模型来解决目前AI研究方向挑战,并最终在游戏里来给暴雪提供反馈数据,协助星际2的AI学习提高。
最后谷歌声明,感谢暴雪提供的百万份天梯比赛录像,目前研发的自主学习AI尚处初级阶段,甚至在完整地图中,连脚本程式的简单电脑都打不过。而执行微操与预判战术只能在小地图中完成,并且需要耗费大量时间运算才能进行下一步。
构建研究任务与模型:
由于玩家可以采用超过300种的基本行动,与Atari游戏相比,Atari游戏只有大约10个动作(例如上,下,左,右等),所以这对《星际争霸2》的空间研究带来了巨大挑战。除此之外,《星际争霸》中的操作动作是分级的,人们可以自由修改和扩充操作路径,即使是84x84的小屏幕尺寸,也可能有大约1亿个可能的动作。在新公布的API中,你可以自己动手来构建任务与模型,减少研发难度。
人类和对象都可以设定所需要研究的单位
迷你游戏:
本次API版本还包含一系列“迷你游戏”——将游戏分解成多个不同的动作管理模块,可用于研究测试AI对象在特定任务下的性能,例如移动镜头,收集矿物或选择单位。
通过这些“迷你游戏”,研究人员可以更好的改进AI性能。比如以下视频显示的一个受过训练的早期对象(左),在建造的过程中不能保持SCV采矿,而这只是人类微不足道的操作。但经过训练后(右),对象可以采取更有意义的操作行动。
PySC2工具包:
PySC2工具环境包可以提供一个灵活且易于使用的界面来进行游戏。在初始版本中,游戏环境将分解为不同的“特征层”,其中游戏的元素(如单位类型,健康程度和地图可视性)将会彼此隔离,需要保留的是游戏的核心视觉和空间元素。
以下是官方原文:
暴雪娱乐:今天我们非常荣幸地宣布——《星际争霸II》API 的正式推出!我们肯定过去数年间来研究人员使用98版《星际争霸》推动AI所做出的努力。现在通过《星际争霸II》API,研究人员、游戏玩家以及业余爱好者可以掌握这一强大的工具,让这款游戏成为更进一步的AI研究平台,进一步推进人工智能研究。此API还是一个公开给社群使用的实验沙盒,我们可以运用学习式AI与脚本式AI来构建可以使星际争霸II AI社区受益的新工具。
我们也做了大量工作,使DeepMind能在其云端基础架构中大规模执行此API。现在,我们以功能完整的Linux软件包的形式推出此工作成果(该软件包旨在云端设计运行)。这是一个独立的Linux版本,专为搭配API工作进行优化。
在与DeepMind合作的这个项目中,我们学到了很多东西。而且我们也非常开心能够为你提供这些工具,看看大家一起携手可以创造出哪些惊人的成就。
此版本提供的功能集:
脚本 AI API
基于图像 AI API (功能图层):
文档,示例代码和示例机器人
支持离线AI与AI播放
1v1天梯游戏的replay套件*
支持Windows与Mac
API完整功能的Linux软件包
* 除了最初版本之外,replay套件新消息将会持续发布。请注意,在新的《星际争霸II》发布后,可能会延迟一些时间才能使用新的重播套件,这是因为新补丁可能会改变replay格式。
虽然我们已加入一些示例代码和简单的机器人,但请注意,这些工具依然是《星际争霸II》AI研发的基础。最终的研究成果,取决与您的创意、才智与努力。我们很乐意看见社区AI将会往哪种方向发展。
详细资讯请到DeepMind博客,浏览他们的白皮书。
如想快速上手,您可以参加我们在 GitHub 上的开源项目:
Python Protocol Binding Library
PySC2(DeepMind 的工具集)
我们非常乐意倾听您对于本次项目的反馈,并邀请您加入我们星际争霸II API论坛(外服)的讨论。