在任何科学领域,好的研究都是可以复制的。如果其他人能够模仿您的实验并获得相同的结果,那么这预示着该发现的有效性。如果其他人能够改进您的研究以获得更好的结果,那对社区来说就更有益了。
这些理念是 OpenAI Gym 背后的驱动力,这是一个新的人工智能研究平台。今年早些时候宣布的 OpenAI 是由埃隆·马斯克、Y Combinator 的 Sam Altman 和前谷歌员工 Ilya Sutskever 构思出来的。该合作项目承诺进行雄心勃勃的人工智能(AI)研究,同时发布和开源他们所做的一切。该平台希望成为某些 AI 算法的基准标准,并成为人们分享其结果的地方。
然而,一个有趣的观点是,OpenAI Gym 不会根据谁能做出得分最高的算法来设置排行榜。相反,它将专注于推广泛化能力强的算法——也就是说,它们在完成其他类似任务时具有通用性。许多 AI 研究人员认为,泛化能力是实现人类水平智能的最大障碍。目前,能够识别猫的图像的算法无法理解语音,因为它们处理数据的方式不同。泛化能力意味着算法知道如何像人类一样处理这两者。
OpenAI 团队平台不一定是为了进行小的迭代改进。他们希望项目能够改变我们对算法的看法。
“这不仅仅是关于最大化得分;而是关于寻找能够很好地泛化的解决方案,”OpenAI Gym 的提交文档说。“那些涉及特定任务硬编码或未能揭示学习算法有趣特征的解决方案不太可能通过审查。”
OpenAI Gym 平台专注于强化学习,这是一种人工智能的流派,其核心是实现一个任务。如果算法表现好,它就会获得奖励。如果失败,则没有奖励——然后它会尝试其他方法。事实证明,强化学习在机器人和电子游戏方面效果特别好。这与谷歌 Deepmind 用来击败 Atari 游戏的 AI 技术相同。
事实上,Atari 环境将是该网站的一个选项,此外还有模拟机器人和其他棋盘游戏。甚至连如今臭名昭著的中国古老棋盘游戏围棋,也将被纳入其中。
其想法是,研究人员构建他们的算法,然后将它们放入各种环境(算法进行测试的虚拟空间)中。然后,他们可以看到他们的算法在客观测试中的表现,进行调整,甚至发布他们的基准供社区其他人查看。该平台与各种开源人工智能框架配合使用,例如谷歌的 TensorFlow 和蒙特利尔大学的 Theano。
OpenAI Gym 目前处于公开测试阶段,研究人员可以开始提交他们的算法。