

人工智能程序可以轻松且持续地在诸如 国际象棋、扑克 和 围棋 等认知密集型游戏中胜过人类对手——但对于需要肢体灵活性的游戏,机器人要击败它们的生物对手则困难得多。然而,这种表现差距似乎正在缩小,始于一款经典的儿童益智游戏。
瑞士苏黎世联邦理工学院 (ETH Zurich) 的研究人员最近公布了他们的新机器人系统 CyberRunner,该系统利用精确的物理控制、视觉学习和人工智能强化训练,以比人类更快的速度学会玩 Labyrinth。

Labyrinth 及其多种变体通常由一个顶部装有平板木板的盒子组成,该平板木板通过外部控制旋钮在 x 和 y 轴上倾斜。木板上有一个带有许多缝隙的迷宫。目标是将弹珠或金属球从起点移动到终点,而不会掉入缝隙中。可以说,这是一款……令人沮丧的游戏。但是,通过充分的练习和耐心,玩家通常可以学会稳定他们的控制,足够引导弹珠安全通过,并在相对短的时间内完成游戏。
相比之下,据报道 CyberRunner 在不到 5 小时内就掌握了完成游戏所需的灵活性。不仅如此,研究人员声称它现在可以在不到 14.5 秒的时间内完成迷宫——比现有的人类记录快了 6% 以上。
CyberRunner 能够掌握迷宫技巧的关键在于实时强化学习和来自顶置摄像头的视觉输入的结合。CyberRunner 的内存中存储了数小时的《Labyrinth》试错运行数据,使其能够逐步学会如何最好地将弹珠沿路线成功导航。
[相关:这款人工智能程序可以教你如何更好地玩国际象棋。]
“重要的是,机器人不会停止玩游戏来学习;算法与机器人玩游戏的进程是同时进行的,”项目描述中写道。“因此,机器人每一次运行都会变得更好。”
CyberRunner 不仅学会了最快的通关方式——它还通过发现迷宫设计本身的缺陷来实现这一点。在测试可能的路径的过程中,该人工智能程序发现了捷径,使其能够缩短运行时间。基本上,CyberRunner 通过寻找绕过迷宫标记路径的捷径,创建了自己的 Labyrinth 作弊码。
CyberRunner 的设计者已将该项目 完全开源,旨在让世界各地的其他研究人员能够利用和改进该程序的功能。
项目合作者兼苏黎世联邦理工学院教授 Raffaello D’Andrea 在本周发布的 声明 中表示:“在 CyberRunner 之前,只有拥有庞大预算和定制实验基础设施的组织才能在该领域进行研究。“现在,不到 200 美元,任何人都可以参与尖端的人工智能研究。此外,一旦数千个 CyberRunner 在现实世界中投入使用,就可以进行大规模实验,让学习在全球范围内并行进行。”