在 SIRI 出现很久以前, 就有了 Audrey。但甚至在 Audrey 之前,就有了名为 Voice-trol 的、名字颇具挑战性的语音控制系统的蓝图。
1950年6月,《Popular Science》杂志的特约撰稿人 Karl Greif,一位来自纽约州北部的电子技术员,提供了 DIY 说明,教读者如何构建一个最终被称为 Voice-trol 的语音激活开关。当时,语音激活是一项如此新颖的技术,DIY 几乎是爱好者唯一的选择。“你的声音中有力量,”Greif 写道。“它可以用来让许多种类的设备听从你的意愿。”如今,语音命令的替代方案随处可见,但对于大多数“设备”来说,要实现声音的力量,至少需要一些 DIY 能力,比如安装一个集线器并将其与电器集成。
Greif 在1950年的说明中附有电路图和零件清单,包括电阻、电容器、开关、变压器和麦克风。由于他的设计要求用户拆解被语音激活设备的电子内部结构,所以他的 DIY 语音激活并不适合业余爱好者。熟悉焊铁和万用表是先决条件。尽管如此,他的设备可以通过简单的语音命令——或者更准确地说,通过声音——来控制玩具火车、在广告时静音收音机或打开车库门。例如,一个音节的词,如 *stop*,会触发一个电继电器并使火车停下(任何单音节词都可以,或者只是拍一下手)。一个双音节的词,如 *forward*,会触发两次继电器,使火车开始移动。Greif 甚至还提供了婴儿监视器的说明。语音命令单元可以放在婴儿床旁边,并连接到安装在另一个房间的警报铃。每当婴儿哭的时候,警报铃就会响起。四年后,在杂志 《Popular Electronics》 中,Greif 描述了他开发的一个语音激活原型,并将其命名为 Voice-trol,该原型设计用于更轻松地组装到当时流行的玩具火车模型中。
1952年,贝尔实验室推出了一个更加复杂的语音命令机器。Audrey,全称 Automatic Digit Recognizer(自动数字识别器),是一台房间大小的计算机,能够识别从零到九的数字的语音,甚至可以自动拨号。
自 Voice-trol 和 Audrey 以来,语音控制技术已经取得了长足的进步。然而,即使在经历了 重大的语音技术里程碑 半个多世纪后,语音激活家用电器并没有像 Greif 所设想的那样普及(智能电视除外)。虽然我们已经习惯了与设备对话,并通过当今流行的语音助手(如 亚马逊 Alexa、苹果 Siri、谷歌助手 和 微软 Cortana)进行交互,但它们主要用于控制文本和电话等通信,或操作互联网搜索、导航、在线购物和音乐等虚拟服务。与只能检测声音的20世纪50年代的祖先不同,它们能够解析诸如“给妈妈打电话”或“播放 Dire Straits”之类的基本语音命令。但当涉及到控制家电等物理对象时,语音激活需要 更多的努力。你不仅需要采取措施来设置这些智能电器,而且每个设备似乎都有 自己的应用程序和特定的命令,需要一些时间来适应,而且如果设备没有连接到像 Alexa 这样的成熟语音助手,甚至可能需要进行语音训练。即使如此,像 Google Nest 这样的某些控制器还需要进一步的直接训练。此外,至少对于亚马逊和谷歌来说,语音助手 据报道一直未能盈利——从未盈利。
不过,如果你是2020年代版本的20世纪50年代的语音爱好者,好消息是你不需要焊铁。虽然仍然可以按照 Greif 的说明来构建他的语音控制设备,但它远远达不到今天的可能性。此外,你可能会遇到一些麻烦,将该设备集成到当今高度集成的电子产品中,例如 遥控火车组 或时钟收音机。但是,DIY 狂热者可以(某种程度上)从头开始构建一个基本的语音识别命令模块,使用 Raspberry Pi(例如 ReSpeaker 2-Mics Pi HAT,运行 AIY Google Voice Kit)来开发语音助手。然后,使用运行 TinyML 的 Arduino Nano(例如 33 BLE Sense)添加一个自定义关键词检测功能,该功能经过训练,可以解析基本关键词(如 *hey, PopSci*)。或者,直接访问 AIY Google Voice Kit 获取项目教程。
幸运的是,大多数主要的家电制造商都提供 智能电器,可以与应用程序和语音助手进行交互。《Popular Science》杂志 解释了如何使用 Apple 的 Homekit、Google 的 Assistant 和 Amazon 的 Alexa 等语音助手家庭中心来激活您的家居语音控制。然而,在 Voice-trol 出现约七十年后,要用你的声音控制物理对象,仍然需要一些 DIY 知识——在导航无线连接、自定义应用程序和设备特性方面。
阅读更多 PopSci+ 文章。