

能够自行驾驶的无人机已经足够先进,可以降落在移动的航空母舰上,但如果在其路径上出现一棵意料之外的树,它们就会坠毁。现在,一个由五个大学组成的团队,其中包括生物学、计算机视觉和机器人学领域的专家,正致力于教会无人机在飞行中躲避障碍物。该团队获得了海军研究局750万美元的资助,目标是建造一架自主的固定翼侦察无人机,使其能够以每小时35英里的速度在陌生的城市或森林中导航。
该团队的灵感来自于鸽子。这些鸟类生命力顽强、数量众多且易于训练,便于研究。在飞行中,它们通过快速处理模糊、低分辨率的图像来估算自身与前方物体之间的距离,这与无人机需要做的事情类似。而且,至关重要的是,它们倾向于在最后一刻做出决定——在距离障碍物五英尺以内。
第一步是教会机器人区分障碍物和空白空间。工程师们已经找到了如何训练点式拍摄相机在照片中识别面孔:在称为监督学习的过程中,技术人员将数百万张图像输入计算机,并告诉它在图像包含人脸时输出“1”,不包含人脸时输出“0”。但这种监督学习方式对于训练无人机来说,将是极其耗费劳动力的。人类不仅需要标记面孔,还需要标记机器人可能遇到的每一种物体。相反,纽约大学计算机与神经科学教授、无人机视觉团队负责人Yann LeCun正在开发一种软件,该软件将允许无人机在较少的人类指导下得出其所见内容的结论。通过模仿大脑视觉皮层用于分类物体的超高效并行处理方法,该软件可以更快地从原始视频帧中提取特征。因此,无人机的人类指导者只需要向其展示几百到几千个每个类别的物体(“汽车”、“树”、“草”)的示例,它就可以开始自行分类这些物体了。
第一步是教会机器人区分障碍物和空白空间。研究人员教会无人机看见之后,还需要教会它做决定。这涉及到处理视觉数据的固有模糊性——决定前方像素的图案是一棵树枝还是一个阴影。卡内基梅隆大学的机器人学家Drew Bagnell和Martial Hebert正在开发算法,这些算法将帮助机器人像人类一样处理视觉模糊性:通过做出明智的猜测。“他们可以这样说:‘我99%确定在12米到13米之间有一棵树’,然后仍然做出决定,”Bagnell说。
做出这些决定需要大量的计算能力。无人机在考虑下一步行动时,必须每秒处理30张图像。LeCun表示,一台每秒能以一万亿次运算速度运行其算法的处理器就可以完成这项任务,但挑战在于将所有这些能力构建到一个足够轻巧高效以供飞行的计算机中。最佳选择是LeCun与普渡大学的Eugenio Culurciello合作开发的处理器:一款名为NeuFlow的、大小如DVD盒的低功耗计算机,LeCun有信心在其2015年的截止日期前将其速度提升到每秒一万亿次运算。
一旦他们建造出能够快速学习、观察和做出决定以避开障碍物的机器人,他们仍然需要教会它飞行。麻省理工学院的机器人学家Russ Tedrake已经在使用运动捕捉相机和最终无人机的全尺寸原型来模拟它需要执行的机动动作。如果团队成功,结果将是一个能够深入森林并让当今的无人机在树林中迷失的机器人。
过滤世界
当无人机飞行时,其机载摄像头将视频馈送到软件,该软件对每一帧应用一系列滤波器。第一个滤波器会检测出像素分组中的模式,这些模式指示简单的特征,如边缘。接着,另一系列滤波器寻找更大的模式,从单个像素构建到物体再到复杂的视觉场景。在百分之一秒内,软件将构建出前方场景的低分辨率地图。最后,它会将视野中的物体与它以前“见过”的物体进行比较,一旦有足够的信息做出明智的猜测,就会立即对其进行分类。
Andrew Rosenblum在四月刊的文章中写到了能够扑灭航空燃油火灾的卡车。他住在加州奥克兰。