AI 将帮助您在视频通话中屏蔽狗叫和小孩的尖叫声

谷歌和微软正在推出令人印象深刻的自动功能,以在网络会议中消除背景噪音。
Microsoft noise suppression
将来,这种大声吃零食的声音可能不会再困扰您。微软

当社交距离开始实施时,视频通话迅速成为人际沟通的基本方式。这种工具与面对面会议不同,但仅仅看到其他面孔就让传统的纯音频会议通话显得过时。然而,经过几个月的隔离,视频通话的新鲜感已经褪去,令人讨厌的怪癖也变得更加明显。背景里的狗叫声不再像以前那么可爱了,任何在脑力激荡期间吃零食而不静音麦克风的人,都应该被关进复仇者联盟关押超级反派的那种巨型监狱。

然而,现在,微软和谷歌等公司正在加紧利用人工智能的力量,在视频通话中消除令人讨厌的背景噪音。事实上,谷歌已经开始向部分 G Suite 企业客户推出其降噪功能,并且在未来几个月内将推广给更多用户。

本周,谷歌向 Venture Beat 展示了其开始实施的降噪技术。演示令人印象深刻。演示者、G Suite 产品管理总监 Serge Lachapella 演示了各种不同的声音,包括拍手声、袋子摩擦声,甚至是用金属内六角扳手敲击玻璃杯的声音。当他开启降噪功能时,他的声音听起来有些模糊,但几秒钟后就清晰了。更重要的是,分散注意力的声音几乎完全消失了。

Lachapella 使用的是 Blue Yeti 麦克风,这对于播客和主播来说是相当常见的设备,但实现魔术的并不是硬件。相反,谷歌依赖于基于云的人工智能算法,该算法分析音频并剔除令人不快的分散注意力因素,同时保留您的语音。

这与我们通常在耳机方面使用“降噪”一词的情况不同。在这种情况下,耳机产生声波,在噪音试图到达您的耳朵时物理上消除噪音。在谷歌的情况下——以及其他尝试相同方法的公司——一个机器人会分析音频,并在信号传输到您的耳机或扬声器之前从中剥离噪音。

谷歌在语音识别方面并不陌生。谷歌助手多年来一直在收听和解析语音,就在去年,该公司推出了其出奇准确的实时字幕功能,该功能实时将对话转换为纯文本。谷歌利用了这项新技术与其新的人工智能。降噪功能是在云端而不是在用户设备上进行计算,因此它不会比资源密集型的视频通话给本地处理器增加更多负担。

该功能在面向用户推出时将默认开启,这意味着有一天您可能会注意到背景声音消失了。如果您更喜欢未经过滤的音频,可以进入设置将其关闭。在某些情况下,您可能希望这样做。例如,唱歌的声音可能会通过过滤器,而背景音乐则可能不行。

谷歌并非唯一一家致力于改善视频通话音频的公司。早在四月份,微软就展示了一项旨在用于其 Teams 视频聊天功能的类似技术。它使用类似的概念:分析音频并过滤掉它不识别为谈话的声音。

与谷歌的计划一样,微软的 降噪 功能也将在未来几个月内推出。

与大多数人工智能驱动的技术一样,两家公司都预计他们的系统会随着时间的推移而更好地识别不需要的噪音。更广泛的数据集和更多的时间来学习应该过滤和不应该过滤的内容,最终将使其更加有效。这很好,因为您那些吃零食的同事可能短期内不会打算改吃更安静的零食了。

 

更多优惠、评测和购买指南

 
Stan Horaczek Avatar

Stan Horaczek

执行编辑,装备与评测

Stan Horaczek是《Popular Science》的执行装备编辑。他领导着一支热爱装备的作家和编辑团队,致力于寻找和介绍市场上最新、最好、最具创新性的电子产品和更多产品。


© .