EchoSpeech 眼镜可帮助残疾人士 | Popular Science

来自康奈尔大学研究人员的这些时尚眼镜具有一项特殊功能——这与近视无关。镜框底部嵌入了微型扬声器和麦克风，可以发出无声声波并接收回声。

这项功能可以方便地检测嘴部运动，从而使设备能够检测低音量甚至无声的语音。这意味着你可以悄悄说话或动嘴发出指令，眼镜就能像唇语者一样捕捉到它。

这项装置背后的工程师们，名为 EchoSpeech，将于本月在德国举行的计算机协会人机交互计算系统会议上展示他们的论文。“对于无法发声的人来说，这种无声语音技术可以作为语音合成器的绝佳输入，”康奈尔大学博士生、该研究的作者之一张瑞东在新闻稿中说道。这项技术还可以供佩戴者向配对设备（如笔记本电脑或智能手机）发出无声指令。

[相关：您的 AirPods Pro 紧急情况下可充当助听器]

在一项对12名佩戴眼镜的参与者进行的小型研究中，EchoSpeech证明了它能够以低于10%的错误率识别出受试者发出的31个独立指令和一系列连续数字。

EchoSpeech 的工作原理如下：扬声器和麦克风放置在面部两侧的不同镜片上。当扬声器发出约20千赫（接近超声波）的声波时，它会沿着一条路径从一个镜片传播到嘴唇，然后到另一个镜片。当声波从扬声器发出后反射并衍射到嘴唇上时，它们独特的模式会被麦克风捕获，并用于为每个短语或命令制作“回声配置文件”。它有效地工作就像一个简单、微型化的声纳系统。

通过机器学习，这些回声配置文件可用于推断语音，即所说的词语。虽然该模型是针对选定的命令进行预训练的，但它还会为每个用户进行微调，每个新用户大约需要6到7分钟完成。这只是为了增强和提高其性能。

[相关：声带贴片可帮助中风患者和急救人员]

声波传感器连接到一个带有定制音频放大器的微控制器，该放大器可以通过 USB 线与笔记本电脑通信。在实时演示中，该团队使用了一个低功耗版本的 EchoSpeech，该版本可以通过蓝牙与微控制器和智能手机进行无线通信。连接的 Android 手机处理了所有的处理和预测，并将结果传输到某些“操作键”，允许它播放音乐、与智能设备交互或激活语音助手。

“由于数据是在您的智能手机上本地处理的，而不是上传到云端，因此隐私敏感信息永远不会离开您的控制，”康奈尔大学教授、该论文的作者之一François Guimbretière在新闻稿中指出。此外，音频数据比视频或图像需要更少的带宽来传输，运行也更省电。

请在下方观看 EchoSpeech 的实际演示：