英伟达的新流媒体技术可以深度伪造你的脸以节省带宽

它可以节省高达 90% 的视频会议通常所需的带宽。
Nvidia Maxine
除了节省带宽之外,该平台还提供了各种视频通话增强功能。英伟达

您可以通过多种方式提高视频通话的质量,但添加花哨的麦克风和复杂的照明设备只能在一定程度上提供帮助。图形处理单元 (GPU) 制造商英伟达 (NVIDIA) 最近发布了一个新平台,名为 Maxine,该平台为您的视频通话提供了一些由 AI 驱动的升级,其中一些功能游走在令人毛骨悚然和令人惊叹的界限之间。

Maxine 在云端处理数据,而不是在消费者设备上处理。因此,如果流媒体平台启用了该功能,用户就可以获得高级功能的优势,而无需拥有一台足够强大的计算机或智能手机来处理计算。从非常基本的角度来看,这种设备外的计算与 Google Stadia 等应用程序能够实时将高端 PC 游戏流式传输到智能手机上的想法相同。

英伟达的平台内置了各种有用或有趣的应用,但关键在于它能够减少每天大约 3000 万次视频通话所需的带宽。通常,网络会议涉及传输连续的视频流。然而,Maxine 会识别您脸上的关键点,并在观看者的屏幕上重新创建它们,利用 AI 驱动的动画技术来填充缺失的部分。由于该平台不必流式传输整个像素屏幕,英伟达声称 Maxine 可以将视频通话所需的带宽降低十倍。

这个动画过程与您在深度伪造应用程序中找到的驱动程序类似,例如可以将您的面部植入电影片段中的演员。利用这项技术,Maxine 可以为通话的接收方创造更流畅的观看体验。通常,当普通视频通话的连接速度变慢时,它会丢帧,并且人员看起来会冻结。由于 Maxine 只依赖于少量传输的面部数据,因此动画图像即使在短暂中断期间也能平滑移动。

AI 还可以利用面部数据实现更简单的流式传输。面部对齐工具可以让人看起来像是说话者直视镜头,即使他们稍微偏离方向。演示略显令人不安,因为您可以看到实时发生的转变,但如果您加入通话,而对方已经启用了该技术,您可能不会注意到,尤其是当您试图自己看向镜头时。

Maxine 还提供其他基于 AI 的技术,例如实时翻译和逼真的 Memoji 风格的屏幕头像,但它们不像带宽缩减功能那样具有相同的潜在影响力。

Maxine 不会是一款您可以自己下载的应用程序。它是一个供开发人员和制造商构建到其产品中的平台。目前,公司可以申请提前使用该技术,并且很可能会看到其他人尝试类似的功能来减少带宽使用。毕竟,从长远来看,我们似乎将会有更多的视频会议。

 

更多优惠、评测和购买指南

 
Stan Horaczek Avatar

Stan Horaczek

执行编辑,装备与评测

Stan Horaczek是《Popular Science》的执行装备编辑。他领导着一支热爱装备的作家和编辑团队,致力于寻找和介绍市场上最新、最好、最具创新性的电子产品和更多产品。


© .