

观看DARPA机器人挑战赛(DRC)决赛而不感到沮丧是不可能的。在加利福尼亚州波莫纳的Fairplex露天赛道上,机器人被期望完成的任务,该赛道旨在大致模拟一个灾难区域,但以人类的标准来看,这些任务都极其简单。以不超过10英里/小时的速度驾驶一辆多功能车。转动一个阀门。爬几级楼梯。但在DRC的平行宇宙中,完成所有八项极其基本的任务会引起观众的欢呼。在为期两天的比赛的第一天结束后,唯一获得满分八分(每项任务一分)的机器人是Tartan Rescue队的CHIMP。
来自卡内基梅隆大学的灵长类动物启发式机器人,展现了迄今为止DRC最激动人心的运行。它以令人印象深刻的速度沿着土路行驶,但随后却异常缓慢地“退出”,或者用DRC的话来说是“egress”。最后,CHIMP打开了门,不可能的事情发生了。CHIMP摔倒了,在门口的一半处瘫倒在地(如上图所示)。这个似乎不可能摔倒的机器人,我们(以及其他人)不断地将其描述为基本上是防摔的,因为它站姿稳定且使用履带而不是双腿行走,结果却摔倒了。通常情况下,这需要“重置”,人类会帮助机器人站起来,DARPA官员会增加10分钟的比赛时间。由于每台机器在赛道上最多只能花费一小时,而大多数机器人需要更长的时间才能尝试所有任务,因此重置是毁灭性的。
于是CHIMP艰难地爬起来。但由于它的腿卡在了门口,情况似乎毫无希望。对大多数人类来说,这种摔倒的几何形状会很麻烦,但我们会扭动、呻吟,并在几秒钟内重新站起来。CHIMP在那里躺了几分钟。它会移动一条肢体,似乎会认真考虑它的困境30秒,然后再尝试一次。我旁边的摄影师嘟囔道:“这就像看着油漆变干。”
他并非完全错误。CHIMP可能是DRC决赛前几个月以来被报道最多的机器人。它是一个5英尺高的、矮胖的小猿人机器人,在照片中看起来要大得多,也更具威胁性。当它在崎岖的地形上移动时,CHIMP会变成一辆坦克,利用它腿部和前臂的履带以四足方式滚动。现在,DRC的明星摔倒了,而且无法站起来。
但从另一个更重要的方面来看,这位绅士完全错了。因为,尽管看着机器人不断失败,或者花费过多的时间来完成基本任务令人恼火,但这项比赛真正的亮点在很大程度上是看不见的。它在于驱动这些机器的算法,当人类无法控制时。DRC引人入胜是因为它将我们对自主性的现有理解推向了极限,然后将其一分为二。

目前大多数自主机器人要么是哗众取宠,要么依赖于持续不断的高质量数据。当像本田Asimo这样的人形机器人走上舞台跳舞或慢跑时,它遵循的是一个精确编排的剧本。就像一个复杂的发条玩具,机器人工程师会加载Asimo的行为,然后让它自由行动。无人驾驶汽车采用了更复杂的自主技术,但谷歌和奥迪等公司开发的车辆需要海量数据才能运行。没有GPS坐标和预先加载的道路激光地图,这些汽车将是公共危害。如果它们没有误读车载传感器数据而冲入车流,它们就会停滞不前,试图理解周围的世界,包括它们不可避免地会造成的涉及多辆车的连环相撞。
这种对数据的依赖是DARPA上一次机器人比赛的关键要素。在2007年城市挑战赛的早晨,每个团队都得到了一个包含其无人驾驶汽车将要导航的模拟城市的详细GPS地图的U盘。这些数据实际上比标准GPS更丰富,机器人可以遵循更多的坐标。车辆仍然必须使用自主技术来处理环境中的非地图化方面,例如与其他机器人走向同一个交叉路口。但这些机器并非孤军奋战。尽管城市挑战赛的汽车具有革命性,但它们得到了很多帮助。
除了麻省理工学院的机器人汽车,它真的孤立无援。麻省理工学院选择完全基于传感器,放弃了提供的GPS面包屑路径,完全依靠机器人实时感知赛道来指导其行动。这被证明是一个糟糕的游戏计划——汽车一度驶离赛道,在比赛的宝贵几分钟里,它 literalmente 陷入了困境。但最终,这辆机器人以第四名的成绩冲过了终点线。尽管没有赢得奖金,但麻省理工学院的团队负责人约翰·莱昂纳德(John Leonard)即使在失败中也声称获得了胜利。比任何其他竞争对手,包括城市挑战赛的获胜者,麻省理工学院都展示了纯粹的、无条件的自主性。尽管有这次风景优美的绕道,机器人还是完成了任务。根据莱昂纳德的说法,赢得比赛从来都不是计划的一部分。
现在,麻省理工学院正在对DRC采取类似的方法。团队负责人拉斯·特德拉夫(Russ Tedrake)说:“我们的团队几乎可以说是过分地专注于自主性。”DARPA已经强制执行了高水平的自主性,通过降低团队成员与机器人之间的通信信号,尤其是在机器进入模拟设施赛道部分之后。那时,数据连接相当于90年代的拨号调制解调器。随着比赛的进行,传输速度会升降,允许更直接的远程控制窗口。
但正如麻省理工学院在2007年放弃GPS数据一样,麻省理工学院团队选择尽可能少地与国防部提供的Atlas机器人进行接触,该机器人已被团队重命名为Helios。特德拉夫说:“这并非巧合。泰勒致力于自主性,他一直在推动这方面的工作。”他指的是塞斯·泰勒(Seth Teller),城市挑战赛团队的成员,也是麻省理工学院DRC团队的最初领导者,他于2014年去世。

作为新的团队负责人,特德拉夫同样在推动自主性而不是策略。因此,当Helios采取行动时,它几乎不受团队成员的任何输入,尽管更频繁的输入可能会更快地完成工作。人类可以通过图形界面上的对象进行鼠标点击,帮助指出机器人应该使用的工具,但机器人则负责其余的工作。
这种整体方法是DRC团队共享的,这就是为什么观看这些机器人会如此令人痛苦。这也解释了为什么CHIMP在重新比赛时如此困难。一个完全遥控的机器人比一个自主的机器人更容易从困境中解脱出来。DRC中大多数令人费解的延误,即机器在抓取把手之前似乎会盯着门几分钟,都与它们不是巨型遥控玩具的事实有关。它们的算法在持续运转,咀嚼着每一个计划好的动作。
但麻省理工学院是采取极端自主方法的少数团队之一。特德拉夫说:“当我们运行大多数这些任务时,机器人会向我们展示它计划做什么。”机器人决定哪些行为最合适,然后它的主人会观察它们如何执行。洛克希德·马丁公司的Trooper团队似乎也同样放手管束其Atlas。团队负责人托德·丹科(Todd Danko)说:“机器人知道其库中的每种行为都能做什么,所以它会通过行为链向后工作,并开始行动……我们正在努力确保机器人拥有正确的信心。”
看到DRC中部署的各种各样的硬件令人兴奋,这场比赛是整个行走机器人研究领域的熔炉。然而,从长远来看,DRC可能产生的最大影响在于软件,特别是在让一名人类控制多个机器人方面。NASA的喷气推进实验室——其RoboSimian机器人是DRC的明星之一——正在探索一种类似Toughbook的平板电脑,宇航员可以戴在手腕上,来监督一群自主机器。洛克希德·马丁公司也希望将其DRC工作应用于太空系统以及水下机器人,因为其团队在监督人形机器人行动时学到的许多经验都是硬件无关的,并且适用于空中、海上和太空中的机器人。
麻省理工学院已经利用其世界级的机器人研究自主性,这与比赛无关。在为DRC做准备的过程中——我们谈过的每个团队领导者都称其为一项艰苦、耗费精力的经历——麻省理工学院能够利用Helios进行与自主性相关的研究并发表论文。由于提供给DRC团队的Atlas技术上是借用的,特德拉夫希望充分利用团队在硬件上的时间。特德拉夫说:“我们不是在试图获胜。我们参加这场比赛是因为我们想解决真正困难的问题。”
至于CHIMP,它结合了机器人自主性和人为故障排除,最终取得了胜利。它纠正了自己,用非惯用手(右手机械臂在摔倒时损坏)使用了一个电动工具,并最终爬上了楼梯,这是少数能够做到这一点的机器人之一,紧随麻省理工学院的Helios之后。观众们欢呼雀跃,因为通用的自主机器人可能不擅长做简单的事情,但在那一刻,CHIMP是我们所见过的最好的。