

终于,Roomba有了可以恐惧的理由。上周,高端吸尘器制造商戴森(Dyson)发布了其 360 Eye,一款利用全景计算机视觉在家中导航的机器人吸尘器。其他清洁机器人也曾使用摄像头,但从未像这样。顾名思义,Eye可以360度观察,在移动时持续监控周围环境,并利用基于视觉的数据构建地图。因此,虽然以前的家用机器人可能将摄像头对准天花板,但戴森的机器人则能看到前方的地面、挡路的家具,甚至墙上挂着的相框——它的视野向上延伸45度,以捕捉更多的空间地标。据戴森设计工程师尼克·施耐德(Nick Schneider)说:“我们开发视觉技术的原因之一是,人类与世界的互动主要是通过视觉方式进行的。所以,如果我们构建一个能够利用相同线索与世界互动的系统,我们认为该系统将具有显著优势。”
这里的含义是,计算机视觉模仿人类感知,并借鉴了我们物种来之不易、高度进化的生物机械效率。这是一种简化了机器人研究目标的美妙说法,但并不准确。
360 Eye与我们的感知世界的方式完全不同。诚然,人类非常依赖视觉,但我们的硬件和软件与这款机器人,或迄今为止的任何其他机器人,都有着根本性的不同。Eye专有的全景镜头收集光线并将其投射到一个CCD成像传感器上,从而测量机器人周围所有物体的相对距离,而人类视觉则依赖于定向、立体传感器,以及消化原始感官输入的能力。由于我们通常拥有一对朝前的眼睛,因此我们可以获得深度感知的优势,而无需承受将眼球排列在整个头部所带来的认知负担。即使是强大的人类大脑也无法合理处理如此多的数据。因此,戴森的机器人能够看到一个完整、不间断的圆形,这使得它的感知在本质上是非人类的。
这也使得360 Eye成为一项出色的机器人技术,也是解决棘手的计算机视觉问题的最创新策略之一。大多数设计用于在机器人学家称之为“非结构化环境”中运行的自动化系统——在这种环境中,物体可能会突然出现在你的路径中,并且缺乏机器可读的条形码、红外反射器或其他“面包屑”轨迹——都将视觉作为一种辅助感官,而更多地依赖激光、超声波、雷达或这三者的某种组合。其中一个原因就是成本。单个摄像头不一定很贵,但要看到大范围的区域,就需要加载大量镜头和传感器,这可能会变得成本过高。另一个更具技术趣味性的计算机视觉障碍是处理能力。机器如何处理它收集到的所有光子?
多亏了我们头骨里的灰色物质,大多数人类都能很好地处理这个问题。人们能够轻松地从视觉噪声中分辨出特定物体,即时对这些物体进行分类,并生成一个不断更新的意义和后果矩阵。例如,我们知道人类在行走时通常不会互相碰撞,所以走廊里迎面走来的人很可能会让开。你知道这一点是因为你理解什么是眼睛、什么是脸,以及这个人的眼睛和脸是朝向你的,而且他的举止中没有钢铁般的恶意或疯狂的光芒,这可能预示着他会突然撞墙。
机器人对此一无所知。这种缺乏认知——这更多的是一个人工智能问题,而不是一个纯粹的机器人问题——尽管研究人员付出了最大的努力,却使得计算机视觉的用途远不如人类视觉。
顺便说一句,我并不是要否定这些努力,其中一些值得注意。一家总部位于加州的半导体制造商Rambus目前正在开发无镜头视觉传感器,其直径约为200微米,大约是人类头发直径的两倍。由于它们不过是一层塑料薄膜,没有光学玻璃,这些视觉点将非常耐用(能承受数百G的机械力),非常便宜(每个约10美分),并且功耗低,通过局部能源(如微型太阳能电池板)收集能量。换句话说,你可以将它们贴满各个地方,装点机器人的手臂以提供更好的肢体位置感知,嵌入人形机器人的后脑勺以增加整体意识,或者将它们聚集在更传统的摄像头周围。尽管每个点的图像分辨率很低,但它们在识别模式方面表现出色。正如Rambus首席研究科学家帕特里克·吉尔(Patrick Gill)指出的那样,它们可以像许多蜘蛛的小眼睛一样发挥作用。“它们会注意到机器人何时应该注意到某种运动变化,以便它可以将更高分辨率的摄像头聚焦到那个方向,”吉尔说。

尽管Rambus计划明年将原型提供给开发者和创客社区,但这些无镜头传感器对于低成本计算机视觉来说仍然是一种未经证实的策略。另一方面是汉斯·莫拉维克(Hans Moravec),一位开创性的机器人学家,他于2003年共同创办了Seegrid Systems。Seegrid的未来相对不确定——该公司目前深陷 财务困境——但其核心技术一直令人印象深刻。这家总部位于匹兹堡的公司基于莫拉维克在3D视觉方面的工作,为工业场所构建自主叉车和货物搬运车。这些机器人使用一系列廉价的消费级图像传感器尽可能多地观察各个方向,从而获得对环境的广泛视觉感知。这种视觉扫描包括——这一点至关重要——与避免碰撞无关的特征。Seegrid的自主地面车辆(AGV)可以注意到仓库天花板上的某个通风管道相对于堆放在特定架子上的箱子组的位置。这些机器人叉车正在建立态势感知,创建一个包含应避免碰撞的物体以及仅用作地标的物体的地图。通过参考这些地图,它们可以比不断重建熟悉工作空间感知的机器人更快、更自信地移动。
戴森的方法也建立了态势感知,但它使用更少的摄像头,并且记忆更短。360 Eye似乎只有一个CCD传感器,并且不存储它生成的地图,因此每一次清洁运行都是一次对周围世界进行理解的新尝试。换句话说,它的功能不如Seegrid机器人。但没关系。尽管戴森尚未透露Eye明年上市时的价格,但肯定会低于Seegrid为机器人化现有工业车辆收取数千美元的费用。戴森的机器人吸尘器能否在价格上与iRobot的价格从400美元到700美元不等的Roomba系列竞争?我猜不能——在手动控制的吸尘器中,戴森的价格本身就很高,所以预计其首款自动驾驶车型会有相应的价格上涨。然而,它仍然需要足够实惠,才能吸引已经拥有Roomba(或类似机器人)并希望升级的消费者,或者那些一直在等待更令人印象深刻的机器人家务减免尝试的消费者。
当然,在360 Eye实际定价的几个月(甚至一年)前,就称赞戴森低成本的计算机视觉解决方案,未免有些武断。事实上,施耐德并未提供当前摄像头的大量详细规格,例如分辨率,因为在产品于2015年发布之前,硬件很容易发生变化。但其中许多细节与明年的机器人吸尘器业务故事相关,意味着戴森即将与iRobot展开一场殊死搏斗。对于更广泛的机器人领域来说,这里的新闻是廉价、有效的计算机视觉似乎取得了突破,这可能会对自动化吸尘器这一细分市场以外的领域产生影响。对于消费者最想要的那些机器人来说,视觉是必不可少的。能够驾驶、清洁、照顾老人,或者任何需要近距离接触人的机器,都可以从更有用的眼睛中获益。或者,正如字面意思,一只全视的独眼。
关注戴森首款机器人的另一个原因:它可能不会是戴森的最后一款。施耐德无法分享具体细节,但确认该公司不会授权其计算机视觉技术,并将继续探索其他类型机器人的内部开发。“视觉系统使得这是完全可能的,”施耐德说。“敬请关注。”