

许多狗主人都会怀念第一次看到自家毛茸茸的伙伴 成功学会一个新把戏 的时刻,这个把戏他们花了好几个星期来训练。无数的培根味零食和尖细的鼓励话语,都用来换取一个“打滚”或“握手”的勉强及格。事实证明,波士顿动力公司的工程师们也以类似痛苦的奖励过程来训练他们公司的四足机器人“Spot”。而在此情况下,令人垂涎的“把戏”是:一个流畅、不间断的三连后空翻。好孩子?

公司上周晚些时候分享的这段视频(如上)显示,一只橙色涂装的Spot用前两条腿发力,将自己向后抛向空中,翻转,然后四脚着地。机器人狗毫不迟疑地重复了同样的杂技两次。当它最终停下来时,Spot微微鞠躬,伸出左前腿,仿佛带有一丝炫耀的 bravado。视频中,可以看到机器人的一些 工程师 在表演成功后兴奋地欢呼。
此时,读者可能已经对 波士顿动力公司臭名昭著的机器人视频 并不陌生了。这些视频通常展示机器人在 跳舞、跳跃、抛掷重物,以及 执行其他超人(或超狗)般的操作,模糊了令人印象深刻和令人不安的界限。通常,这些杂技表演会作为引人注目的钩子吸引观众,然后解释更实际、更现实的应用场景——这是波士顿动力公司机器人工程师Arun Kumar在视频中承认的一点。
“显然,后空翻并不是我们的客户需要的功能,”Kumar说。“他们可能只是觉得好玩。”
但工程师推动Spot挑战极限也有一些很好的原因。这种四足机器人目前被部署在 汽车制造厂 和世界各地的 危险工业区域。在这些环境中,机器人有可能滑倒、失去平衡或撞到障碍物而翻倒。在这些情况下,机器人能够自救至关重要。Spot也经常携带重物(它用来“看”的摄像头附件 重约20磅),所以重新站起来并不像听起来那么简单。

Kumar表示,这些场景在一定程度上启发了三连后空翻的想法。工程师可以控制Spot腿部的每一个电机,这些电机就像生物体的关节一样工作。他和他的同事进行了测试,目标是“施加电机能够承受的最大力。”
相关:[“跑酷”机器人狗能跳、能跃、能爬,穿梭于复杂的障碍赛道]
“这很像训练一只狗”
在实际层面,让Spot完成三连后空翻与训练真狗有一些相似之处。Spot的软件,和许多高级机器人的软件一样,通过“强化学习”获得新能力。在计算机科学中,机器人的底层软件或“大脑”的任务是反复尝试实现一个期望的目标,并在成功时获得“奖励”。在这种情况下,机器人的奖励(一个简单的代码脚本)类似于拉布拉多犬在勉强坐下时得到一把金鱼饼干。
“这很像训练一只狗,”Kumar在谈到Spot的强化学习过程时说。
但计算机模拟的成功并不能直接转化为现实世界的三连后空翻或任何其他期望的结果。“一旦在模拟中(sim)有什么东西奏效,我们就会将其部署到硬件上,但它第一次从来不会奏效,”Kumar补充道。“它总会以某种方式失败。”
就像训练狗一样,解决这种不匹配的方法是反复尝试。在这种情况下,工程师可以访问Spot的所有摄像头数据,这有助于他们精确地找出导致失败的原因。然后,他们可以使用这些数据来调试软件,应用修复,并一次又一次地运行测试,直到物理机器人能够正确执行。最终,你就会得到一个三连后空翻。
Kumar说,起初,波士顿动力公司的工程师甚至不确定Spot能否完成一个后空翻。现在,他说,如果给予适当的鼓励,这种四足机器人甚至可以连续翻转更多次而不会停下来。
相关:[波士顿动力为Spot机器人披上毛皮外观]