类似“终结者”的视觉能力可以帮助机器人洗碗

再见

如果上面的动图看起来很熟悉,那很可能是因为它与这个场景极其相似

当然,这就是 T-800 终结者在《终结者2:审判日》中从未来降临后,识别和认识世界中的物体的方式。

与电影类似,麻省理工学院计算机科学与人工智能实验室的研究人员开发了一种物体识别系统,该系统可以使用普通的 RGB 摄像头(无需发出威胁的血红色滤光片)准确识别物体。该系统可以帮助未来的机器人更有效地与物体互动,同时在复杂的世界中导航。

“理想情况下,我们希望机器人将来能帮我们洗碗。我们希望识别系统能够识别出机器人应该关注并可以操作的物体,”该研究的首席作者 Sudeep Pillai 说。

该系统建立在经典识别系统以及另一项称为“同步定位与建图”(SLAM)的系统之上,该系统使自动驾驶汽车或机器人等设备能够拥有三维空间感知能力。该团队新的“SLAM 感知”系统在收集多视点物体信息的同时,会绘制出其环境的地图。随着角度的增加,该程序可以通过将物体分解为其基本组成部分来预测物体是什么。然后,它会将编译的描述与现有物体描述数据库进行比较。例如,如果 SLAM 感知系统看到一把椅子,它可能会将其分解为座位、四条腿和一个靠背。

由于 SLAM 感知系统创建了它所看到的物体的三维地图,因此它也能更好地将一个物体从另一个物体中区分出来。每个新的视角都为每个物体增加了描述性信息。该系统减少了歧义,并提高了正确分类物体和区分不同物体之间的可能性。

麻省理工学院

SLAM 感知系统与研究团队称之为“SLAM 忽略”的经典图像识别系统不同,后者不会创建三维地图,并且一次只能检测一个静止帧的物体。相比之下,SLAM 忽略系统在拥挤的环境中识别多个物体时遇到的困难比 SLAM 感知系统大得多。在下面的动图中,错误的预测会闪烁红色。

在一项实验中,SLAM 感知系统能够以 86.1% 的准确率正确识别物体场景,这与先进的专用系统相当,这些系统可以考虑红外光的深度信息。尽管这些专用系统非常准确,准确率高达 92.8%,但代价是时间。其中一些系统的运行时间约为 4 秒,而 SLAM 感知系统的运行时间为 1.6 秒。使用红外光的系统在户外工作时也存在困难,因为光照条件复杂。

“你不能在户外使用它,这从机器人学的角度来看有点不切实际,因为你希望这些系统能够在室内和室外工作,”Pillai 说。

未来,Pillai 和他的团队希望在他们的系统基础上,解决一个经典的机器人学挑战,称为“回环闭合”。这是指机器人无法识别它们之前去过但又很重要的地方,这对于导航和与世界互动至关重要。SLAM 感知系统可以通过允许机器人识别不同地点中的特定物体并将它们归类为该特定地点更重要的物体,来开始解决这个问题。

研究人员本月在意大利罗马举行的 机器人科学与系统大会上展示了他们的研究。

“我们不想与竞争的识别系统竞争,我们希望能够以一种 nice 的方式将它们集成起来,”Pillai 说。

至于 SLAM 感知系统是否能帮助定位和保护 约翰·康纳,目前还没有消息。

 

更多优惠、评测和购买指南

 
© .