为什么 DARPA 希望其机器人像孩子一样思考

如果机器能够像孩子一样熟练地学习,军方认为它们或许能在许多方面提供有用的帮助。
好孩子。DARPA

学会走路就是从失败中学习,然后再次尝试。每迈出一步,都伴随着身体的不平衡,以及地面纹理或密度可能与之前不同的可能性。一个在摇晃的船甲板上学会走路的蹒跚学步的孩子,当在陆地上时,可能会遇到困难,因为脚下的地面不会像预期那样移动。

对于 DARPA(军方的“蓝天项目”部门)来说,教会机器人在新地形上行走意味着像蹒跚学步的孩子一样拥抱学习。学走路始于大量的失败,但通过学会如何适应失败,机器人就能仅凭直觉应对全新的环境。

这就是 机器学习通用知识(Machine Common Sense)的领域,这是 DARPA 的一项计划,旨在开发一种人工智能,使机器人在模拟环境中,然后是现实世界中,能够模仿蹒跚学步的孩子理解、互动和导航世界的能力。这包括处理语言、操纵物体以及跨越不熟悉地形的努力。

“该计划的灵感在于,尽管人工智能已经创造出许多令人惊叹的系统,在许多任务上都展现出了专家级的表现,但总的来说,人工智能系统很脆弱,往往缺乏街上任何一个人都具备的常识,”DARPA 的机器学习通用知识项目经理 Howard Shrobe 说。

“然而,最终目标是使计算机系统和机器人系统能够以与我们训练士兵在其军事工作中涉及的技术领域相同的方式进行训练,”Shrobe 说。

只需阅读说明

Shrobe 设想,如果机器能够像人类一样熟练地学习,那将多么有用。“长远来看,你可以想象一个机器人技术员阅读关于车辆发动机维修的说明手册,并能够将这种语言描述和可能的视频转化为行动,因为它完全有能力弄清楚如何将它已知的动作组合起来完成说明中隐含的任务,”Shrobe 补充道。

要做到这一点,人工智能不仅要能吸收手册并重复其中的信息,而且还要能辨别出说明中未明确说明但对整个过程至关重要的所有内在知识。

[相关:谷歌通过模仿现实世界教会机器人狗新技巧]

“你可以想象一份炒鸡蛋的食谱,它可能会以‘将两颗鸡蛋放入碗中’开始。即使是我们这些厨艺很差的人也明白,它并不是字面上让你把两颗鸡蛋扔进碗里。它的意思是把鸡蛋打入碗中。它没有告诉你鸡蛋可能在哪里,也没有告诉你如何打鸡蛋,”Shrobe 说。

食谱与其他说明手册一样,都基于这样的前提:翻阅书籍的人已经了解了这种隐含的信息,因此读者可以专注于手头的任务。如果军事机器能够配备能够从阅读中辨别常识的人工智能,那么这些人工智能就可以执行专门的任务,而无需首先学习任务的所有组成部分。

机器能否学会物体恒存?

为机器开发常识意味着重新审视人工智能系统如何感知、整合和适应新知识。其中一些知识是关于身体如何在空间中工作和存在的,比如在新的、不平坦的地形上行走。另一部分是教图像识别程序拥有物体恒存概念,这样,如果摄像头看到一个球滚到墙后面,当它从另一边出现时,就不会将其视为一个新物体。这是人类通过直觉获得的知识,尽管通常需要通过一些反复试验,在婴儿时期就能获得。

对于学习物理任务的机器来说,这些知识不是通过阅读手册获得的,而是通过执行和适应能够处理意外变化并将其转化为知识的程序获得的。一个例子是,一条四足机器人即使在背部被投掷重物的情况下也能保持平衡。

导航手册和克服障碍物所需的通用机器学习过程,都建立在相同的机器学习和深度强化学习过程之上。在模拟环境中,人工智能会理解任务的参数,并在获得新信息时提出处理方法。这意味着要借鉴积累的经验,并尝试一种近似于当前情况的策略。而且,至关重要的是,在人工智能尝试在现实生活中处理任务时进行学习。

在模拟中,机器人可能会翻过一座小山,然后在山的另一边被一些煤渣砖绊倒。在现实生活中,该机器人可能会登上山顶,然后遇到一根倒下的原木。由于在模拟中经历过绊倒,该机器人就可以在遇到类似情况时避免摔倒。

[相关:新型尾部配件驱动这款机器人狗游过溪流]

通过学习什么行不通,更重要的是通过学习和重复什么行得通,DARPA 正在开发的 AI 将使机器能够在不熟悉的环境中完成熟悉任务。虽然 Shrobe 提到了婴儿,但这实际上也是我们对成年人,尤其是那些参军的年轻成年人所期望的那种对世界的普遍适应能力,他们被期望掌握在训练中学习到的任务,并在他们可能以前从未听说过的世界各地执行任务。

虽然 Shrobe 设想的完全能够操作的机器人技术员仍然遥遥无期,但通过 DARPA 的机器学习通用知识计划,各团队正在致力于开发和评估组成部分。这意味着不仅要重复手册中的文字,或者证明机器人可以在不平坦的地面上行走,还要测试 AI 是否能在语言测试中生成连贯的下一句话,或者机器人是否能在突然变得油腻的不平坦地面上行走。

一个清晰的例子是,在模拟环境中训练 AI,以通过儿童的相同测试,来判断他们是否已经发展出前面提到的物体恒存的概念。

“你展示一个物体滚到屏幕后面,然后它再也没有出来。你现在可以问 AI 系统,你能找到这个物体吗?如果它在模拟环境中导航到屏幕后面,那么你就可以假设它拥有物体恒存的能力,因为它认为物体滚到屏幕后面就停在那里了,而不是滚到屏幕后面就消失了,”Shrobe 说。

观看 AI 在下方的地形上指挥一条四足机器人

 

更多优惠、评测和购买指南

 
Kelsey D. Atherton Avatar

Kelsey D. Atherton

科技领域特约撰稿人

Kelsey D. Atherton 是一名军事技术记者,自 2013 年起为《大众科学》供稿。他报道无人机器人和其他无人机、通信系统、核企业以及用于规划、发动和缓解战争的技术。


© .