哥伦比亚大学的研究人员成功开发了一种自主机器人手臂,它能够通过观察自身运动来学习新的动作并适应损坏。这款机器人会观察自身运动的视频,然后利用这些数据来规划下一步行动——研究人员将这种做法称为“运动自我意识”。这种独特的学习过程旨在模仿人类通过照镜子来调整某些动作的方式。
以这种方式教导机器人学习可以减少在定制的3D模拟中进行大量训练的需要。它还可能在未来使在现实世界中运行的自主机器人在没有持续人类干预的情况下,更好地适应损坏和环境变化。这些发现本周发表在《Nature Machine Intelligence》杂志上。
从照镜子的婴儿和舞者那里获得灵感
人类是少数几种进化出识别自身倒影并从中学习的动物之一。幼儿会在镜子或池塘中认识到自己崭新而奇特的身躯,注意到自己看到的东西,并在三维空间中形成一个关于自身的“心智模型”。这种观察有助于运动、协调和早期语言技能的发展。研究人员称之为“自我模拟”的过程不仅适用于儿童。舞者也会定期分析自己的倒影,以纠正姿势并获得即时的视觉反馈。
在这项研究中,研究人员希望找到一种方法,将类似的自我模拟过程应用于自主机器人。通常情况下,机器人工程师会在高度详细和精心设计的虚拟模拟环境中训练驱动机器人的AI模型。通常是在经过大量的训练之后,模型才会被应用于物理机器。但这个过程在多方面都存在局限性。首先,高级模拟可能需要很长时间才能完善,并且通常需要广泛的工程专业知识。它们在适应性方面也受到一定限制。如果在物理世界中发生了一些在模拟训练参数之外的意外情况,机器人可能难以妥善响应。
“我们的目标是让机器人能够理解自己的身体,适应损坏,并在没有持续人类编程的情况下学习新技能,”哥伦比亚大学博士生、论文第一作者Yuhang Hu在一份声明中表示。

为了实现这一点,研究人员开发了一种新的“自监督学习框架”,该框架由三个独立的深度神经网络组成。一个坐标编码器首先处理通过单个摄像头捕获的机器人原始视频,研究人员将此过程比作人类照镜子。然后,一个运动编码器将图像(包括突出显示机器人关节和其他运动区域的数据)转换为二进制图像。最后,预测模型通过指导物理机器人手臂如何在现实世界中移动来完成整个过程。结果是,机器人可以根据来自摄像头的视频数据不断调整其运动,而不是依赖于虚拟训练模拟。
机器人手臂能够即时适应损坏
研究人员通过让机器人手臂执行一些基本任务来测试他们新的学习框架。首先,他们展示了手臂如何仅仅通过观看自己成功越过障碍物的视频帧来避开障碍物(在此情况下是一个纸板状的隔板)。更有趣的是,他们还展示了相同的模型如何帮助机器人适应损坏。研究人员想看看机器人如何应对一个假想的场景,即一个过重的负载导致其肢体弯曲。为了测试这一点,他们3D打印了一个损坏的肢体并将其安装在机器人上。在观看自己安装了新肢体的视频后,模型能够改进其预测,并调整机器人的运动以补偿模拟的损坏。
研究人员在论文的预印本版本中写道:“我们的结果表明,这种自学习模拟不仅能够实现精确的运动规划,还能让机器人检测异常并从损坏中恢复。”
自我模拟可以帮助未来的自主机器人以更少的人类干预进行操作
论文中演示的自我模拟方法可以帮助改进各种未来的自主机器人,这些机器人有一天可能会被部署用于各种任务,从制造业工作到环境监测和工业监测。这些机器人从摄像头数据中学习,甚至适应损坏的能力可以减少停机时间,并防止人类维修人员不必要地暴露在潜在的危险环境中。自我修复能力在机器人辅助老年护理和儿童护理等领域可能更为重要,因为这些领域中机器人的损坏可能会立即影响人的福祉。
这种方法也有一些更实际的好处。研究人员指出,例如,一台能够自我修复的吸尘机器人理论上可以使用这些技术来调整其运动,以应对它撞到墙壁并导致某个肢体稍微错位的情况。换句话说,在杂乱的公寓里横冲直撞的笨拙的Roomba有一天可能更有机会生存下来。
哥伦比亚大学教授、论文合著者Hod Lipson说:“我们人类不能负担得起不断地溺爱这些机器人、修理损坏的零件和调整性能。机器人需要学会照顾好自己。”