研究人员如何训练一只廉价的机器狗表演技巧

一种新的“跑酷算法”首先在虚拟环境中训练机器狗。
robot dog doing parjour
Zipeng Fu / YouTube

虽然双足类人机器人是科幻电影中的常客,但对于许多潜在的现实世界任务,例如从着火的建筑物、被淹没的街道或极寒的荒野中营救人员,四足“机器狗”则更胜一筹。 在即将于下个月在亚特兰大举行的机器人学习会议 (CoRL) 上发表的一篇新论文中,斯坦福大学和上海奇志研究院的研究人员提出了一种新颖、简化的机器学习技术,该技术允许他们训练一种基于视觉的算法,使(相对)廉价的现成机器人能够在现实世界中攀爬、跳跃、爬行和奔跑。正如研究人员声称的那样,它们可以自己进行“跑酷”。

传统上,教会机器人导航世界一直是一项昂贵的挑战。波士顿动力公司的 Atlas 机器人可以跳舞抛掷物品,并通过跑酷方式穿过复杂的环境,但这是十年多 DARPA 资助的研究的结果。正如研究人员在论文中所解释的,“为预测控制对机器人及其周围环境建模所需的大量工程工作以及高昂的硬件成本,阻止了人们在合理预算下复制跑酷行为。”然而,人工智能的最新进展表明,在计算机模拟中训练算法,然后将其安装到机器人上,是一种经济高效的训练它们行走、爬楼梯和模仿动物的方法,因此研究人员着手为低成本硬件上的跑酷做同样的事情。 

研究人员使用两阶段强化学习来训练跑酷算法。在第一个“软动力学”阶段,允许虚拟机器人穿透和碰撞模拟物体,但通过简单的奖励机制鼓励它们最小化穿透以及清除每个障碍物并前进所需的机械能。虚拟机器人没有收到任何指示——它们必须自己弄清楚如何最好地前进,这就是算法学习什么有效、什么无效的方式。

在第二个“硬动力学”微调阶段,使用了相同的奖励机制,但不再允许机器人与障碍物碰撞。同样,虚拟机器人必须弄清楚哪些技术最适合在最小化能量消耗的同时前进。所有这些训练都使研究人员能够为每项技能开发一个“单一的基于视觉的跑酷策略”,该策略可以部署在真实的机器人上。

结果非常有效。尽管该团队使用的是身高仅略高于 10 英寸的小型机器人,但它们的相对性能令人印象深刻——特别是考虑到简单的奖励系统和虚拟训练程序。这些现成的机器人能够攀爬高达 15.75 英寸(是其身高的 1.53 倍)的物体,跳过 23.6 英寸宽(是其长度的 1.5 倍)的间隙,爬过低至 7.9 英寸(是其身高的 0.76 倍)的障碍物,并倾斜以挤过比其宽度窄零点几英寸的间隙。 

根据斯坦福大学新闻中对研究人员的采访,最大的进展是新的训练技术使机器狗能够仅使用其车载计算机和摄像头自主行动。换句话说,没有人通过遥控器操作。机器人正在评估它们需要清除的障碍物,从它们掌握的技能库中选择最合适的方法,并执行它——如果失败了,它们会再次尝试。

研究人员指出,他们训练方法最大的限制是必须手动设计模拟环境。因此,未来,该团队希望探索“3D 视觉和图形学的进步,以便从大规模真实世界数据中自动构建多样化的模拟环境”。这可以使他们训练出更多冒险的机器狗。

当然,这个斯坦福团队并不是唯一一个研究机器狗的研究小组。在过去一两年里,我们已经看到了各种形状和大小的四足机器人,它们能够用爪子开门爬墙和天花板在沙地上冲刺,以及在平衡木上行走。但尽管如此,距离我们看到救援机器狗出现在野外还有一段距离。看来拉布拉多犬的工作还不保。

在下方观看它们的实际表现

 

更多优惠、评测和购买指南

 
Harry Guinness Avatar

Harry Guinness

撰稿人

Harry Guinness 是一位爱尔兰自由作家兼摄影师。他一年中的大部分时间在爱尔兰和法国阿尔卑斯山之间度过。Harry 的作品发表在《纽约时报》、《流行科学》、OneZero、Human Parts、Lifehacker 等数十家媒体上。他撰写关于科技、文化、科学、效率以及它们碰撞的文章。


© .