谷歌的 AI 视频创作者迎来重大升级。如何使用它。| Popular Science

随着每个月过去，AI 生成的内容越来越难以与人类制作的内容区分开来。谷歌最新的视频制作者就是例证：新推出的 Veo 3 模型在逼真度方面有所提升，同时首次加入了音频，可以添加同步对话、自然音效和其他音效。

谷歌承诺新的 Veo 3 模型对现实世界物理的理解更好，并且更智能地将您的文本提示转化为视频片段。目前，这些片段的长度限制为八秒，分辨率为 720p——这可能是因为生成这些视频需要高昂的计算（和环境）成本。

正如 AI 升级的常态一样，谷歌不谈论能源使用或这些模型经过了什么训练，但它已邀请电影制作人 Dave Clark、Henry Daubrez 和 Junie Lau 协助推广 Veo 3 的功能。短片已经开始创作，更多短片正在制作中。

同时，谷歌还发布了一个名为 Flow 的在线视频编辑器，您可以将场景串联起来，以更结构化的方式使用AI 进行创作。如果您不想创作任何内容，但想看看这些工具能做什么，那就坐下来，在浏览器中观看一些 Flow TV 吧。

那么，Veo 3 如何影响 AI 视频制作的现状？很明显，我们将看到比以往更多的深度伪造 (deepfakes)，区分真实视频和 AI 视频将变得更加困难——正如您将在下面收集的示例中所见，一系列全新的 AI 视频创作成为可能。

人们正在创作什么

您不必费心寻找 Veo 3 应用的例子。也许谷歌自己的展示视频是一个不错的起点：您可以看到羽毛在空中飘浮，林中的动画角色，侦探审问一只橡皮鸭，以及一位小提琴家演奏音乐。

这些片段展示了 Veo 3 在视频质量和配套音频方面取得的一些飞跃。总的来说，音乐和对话与视频完美匹配，增强了整体效果——看起来确实像是真演员在说真台词。

然而，即使是谷歌精心挑选的片段也并非完美无瑕。物理现象常常显得怪异，而且我们无法得知最终结果与使用的文本提示的契合度有多高，因为它们并没有包含在内。创建逼真的 AI 视频是一回事，但要严格按照提供的文本说明来制作是另一回事。

最近在 Instagram 上走红的一个 Veo 3 系列是《帝国冲锋队员的 Vlog》，讲述了一个名叫格雷格的倒霉帝国冲锋队员的冒险经历。该系列在多个视频和多个场景中保持一致性方面做得非常巧妙——因为所有帝国冲锋队员看起来都一样——它再次展示了 Veo 3 所能实现的视频质量。

AI 视频生成器在制作街头采访视频（vox pop）方面也表现出色：例如，观看《纽约的无尽长队》这个片段。如果仔细观察，仍然会发现一些不一致和错误，但它仍然是YouTube上真实生活采访的令人信服的人工模仿。

这些 AI 采访看起来如此逼真，部分原因在于 Veo 3 已经对类似的视频进行了大量训练。请注意，摄像机角度几乎总是相同的，人物看起来也比较普通。当涉及到创建更奇特的内容时，Veo 3 的训练数据较少，能力也就没那么强。

如何使用 Veo 3

目前，您需要订阅每月高达 250 美元的 Google AI Ultra 套餐才能充分利用 Veo 3。对于普通用户和对 AI 感兴趣的人来说，这是一个很高的要求，但对于创意工作室或电影公司来说，这可能不算什么大开销。即便如此，仍有使用限制，尽管这些限制并未明确说明（限制通常取决于谷歌 AI 基础设施在特定时间的压力大小）。

如果您选择每月 20 美元的 Google AI Pro 套餐，您每天可以获得 3 个“Veo 3 Fast”积分。这是 Veo 3 的一个更快、质量较低、能耗较低的版本，尽管谷歌并没有详细说明 Veo 3 和 Veo 3 Fast 之间的区别。随着时间的推移，这些配额可能会发生变化。