

Robo Brain 并非真正意义上“饕餮”互联网。这暗示着选择或自主权。Robo Brain 所经历的更像是“强制喂食”,因为来自四所不同大学的研究人员会定期将从互联网收集的数据挤入其云端计算系统。到目前为止,它已经消化了大约 120,000 个 YouTube 视频、一百万份文档和十亿张图片。
这个项目的目标与其名称一样直接——创建一个集中式、永远在线的大脑供机器人接入。Robo Brain 从互联网学到的越多,就能与连接的机器分享越直接的课程。如何打开烤面包机?Robo Brain 知道,并且可以分享该电器及其相关组件的 3D 图像。它可以告诉机器人咖啡杯是什么样的,以及如何握住杯柄而不打翻里面的东西。它可以通过测量相对位置来识别人类何时在看电视,并建议避免在两者之间走动。Robo Brain 查看椅子或凳子,就知道这些是人们用来坐的东西。这是一个理解上下文的系统,并将复杂的关联转化为物理机器人的直接命令。
如果这些任务中没有一个看起来特别令人印象深刻或具有挑战性,那是因为对人类来说它们并非如此。而与此同时,机器人却需要它们能够获得的所有认知帮助。即使是最自主的机器也遵循狭窄的预设行为模式,在没有广泛且通常昂贵的培训或重新编程的情况下,几乎无法适应新情况。要使机器人成为普遍的社会财富,适应性至关重要。例如,一家老年护理机器人可能不仅需要了解如何从微波炉中取出热腾腾的汤碗,还需要了解在哪里将其放在桌子上,以及与主人相对于其的位置。一个简单的要求,比如“那个带条纹的杯子”或“大一点的勺子”,就可能让机器束手无策。
Robo Brain 的解决方案是一个庞大且迅速扩张的流程图。该系统会将所有输入的数据进行分类,并集中精力确定何时以及如何执行特定的物理操作。Robo Brain 随时准备付诸行动。因此,勺子和碗有相互连接的节点,但不要指望康德的著作会出现在这个职业性的“蜂巢思维”中。这种对行动的关注将该项目置于与 RoboEarth 相同的总体领域,RoboEarth 是一个正在进行的非营利性项目,旨在创建一个机器人可读的知识存储库。然而,关键的区别在于,Robo Brain 是自给自足的,它不断地增加其结论和相关行动的网络(RoboEarth 的文件需要由人类处理和组织)。它也不同于其他人工智能的“深度学习”方法,例如 Google Brain。Robo Brain 不试图模仿人类感知和处理数据的方式,而是简单地组织信息,按上下文对主题进行分组和连接。椅子被分解为椅子的子集,分支指向椅子的用途以及它们与其他类型家具的关系。咖啡与杯子相连,也与倒液体相关的运动规划相连。这是一种认知上的“暴力破解”方法,它回避了真正智能的细微之处,以便提供具体的指令。如果你告诉机器人给你拿一杯咖啡,它可以查询 Robo Brain,然后拼凑出一系列相关的命令。
但是,随着系统庞大的图谱不断增长,Robo Brain 越来越不像智能的幻觉,而更像真实的事物。根据康奈尔大学计算机科学助理教授 Ashutosh Saxena 的说法,迄今为止最好的例子出现在研究人员要求该项目的三个机器人之一制作阿芙佳朵(affogato)时。这款机器人是一个双臂、高度灵巧的 PR2,它查询了该系统,并了解到阿芙佳朵是一种意大利甜点,由冰淇淋和咖啡组成。在没有任何人类指导或干预的情况下,机器人找到了咖啡,弄清楚了如何将其从分配器中取出,并将其倒在了舀好的冰淇淋上。
同样,这对我们这些拥有发达大脑的生物来说是小菜一碟。但对于机器人来说,能够响应一个相对模糊的请求,通过一系列查询和命令得出具体且正确的结果,这是令人惊讶的。需要明确的是,研究人员并没有将完整的阿芙佳朵或咖啡制作序列输入到该 PR2 中。输入到 Robo Brain 的数据是按主题整理的,但本质上是原始的——DIY 视频、说明手册和操作指南。该系统输出的解决方案也同样是看似“即兴”的。Saxena 表示:“现在它是自动化的,因为四所大学,我们把知识推送到系统中。我们不需要做任何其他事情。”
目前,Robo Brain 的输入来自布朗大学、康奈尔大学、斯坦福大学和加州大学伯克利分校的研究人员。但到 10 月份,该项目将扩展到总共 10 所大学,到年底,任何学校的申请者都可以申请访问。届时,Saxena 预计 Robo Brain 将吸收十亿个视频和一百亿份文档,云计算成本将达到每天 1000 美元。目前的资金,部分来自谷歌和微软等赞助商,约为 150 万美元,足以在未来几年内为该系统提供充足的“食粮”。尽管如此,Saxena 估计,可能需要五年时间,该系统才能真正投入使用,并准备好发挥作用。
Saxena 说:“我们完全以开源的方式完成。与其他一些大学项目或公司不同,我们的目标不是盈利。”他认为老年护理和家用机器人是 Robo Brain 最主要的初始受益者。“我们正在让世界变得更美好。”