人形机器人一直是科技巨头和实验工程师的激情项目。如今,似乎每个人都想要一个。但对于机器来说,社交技能很难学会,而且这些机器人通常难以融入人类世界。
中国消费电子公司小米在八月份曾暗示他们正在制造这样一台机器。据《IEEE Spectrum》报道,该公司发布的消息称,这款名为 CyberOne 的身高 5 英尺 8 英寸的机器人可能并不是为了实用性,而是“一种探索技术可能性,并可能在其他地方找到有用应用的方式”。
至于机器人的规格,该公司表示,CyberOne 配备了“深度视觉模块”以及人工智能交互算法。它还可以支持高达 21 度的运动自由度,并具有“能够完全模拟人类动作”的实时响应速度。
小米刚刚公布了一段 CyberOne 的新视频,视频中它正缓慢而准确地敲击着一套多乐器架子鼓。它能够精确地协调一系列复杂的动作,包括敲击鼓槌、踩钹、踩踏板以及一套四只鼓,发出各种声音。这肯定比过去那些更粗糙(有时甚至是无头的)机器人乐队和管弦乐队要优雅和进化得多。
[相关:Spotify 如何训练 AI 转录音乐]
那么 CyberOne 是如何知道该做什么的呢?小米绘制了一张图表,展示了声音文件如何转化为 CyberOne 的动作。首先,鼓的位置和敲击速度指令是在线微调的。然后,这些节拍通过MIDI 文件被传送到 CyberOne,MIDI 文件会告诉计算机演奏了什么乐器、乐器上弹奏了什么音符、音量有多大、演奏了多长时间,以及是否有任何效果。然后,机器人使用离线动作库来生成表演动作,并仔细确保击打正确的乐器并且节奏准确。
即使对人类来说,简洁、有控制、协调一致地执行指令也是一项困难的练习。人形机器人与普通机器人不同,因为它们旨在模仿自然动作,但在现实世界中却往往不实用。它们需要专门的训练才能完成最简单的功能(例如不摔倒)。能够掌握打鼓等技能的人形机器人,对于各种涉及操纵或与环境中物体交互的复杂任务可能非常有用。
“我们正在开发 CyberOne 的第二代,并希望进一步提高其运动和操控能力,”小米机器人实验室高级硬件工程师Zeyu Ren告诉《IEEE Spectrum》。“在硬件层面,我们计划增加更多的自由度,集成自主研发的灵巧手,并增加更多的传感器。在软件层面,将开发更强大的运动和视觉控制算法。”
在下方观看 CyberOne 的演奏视频