

随着每个月过去,AI 生成的内容越来越难以与人类制作的内容区分开来。谷歌最新的视频制作者就是例证:新推出的 Veo 3 模型在逼真度方面有所提升,同时首次加入了音频,可以添加同步对话、自然音效和其他音效。
谷歌承诺新的 Veo 3 模型对现实世界物理的理解更好,并且更智能地将您的文本提示转化为视频片段。目前,这些片段的长度限制为八秒,分辨率为 720p——这可能是因为生成这些视频需要高昂的计算(和环境)成本。
正如 AI 升级的常态一样,谷歌不谈论能源使用或这些模型经过了什么训练,但它已邀请电影制作人 Dave Clark、Henry Daubrez 和 Junie Lau 协助推广 Veo 3 的功能。短片已经开始创作,更多短片正在制作中。
同时,谷歌还发布了一个名为 Flow 的在线视频编辑器,您可以将场景串联起来,以更结构化的方式使用AI 进行创作。如果您不想创作任何内容,但想看看这些工具能做什么,那就坐下来,在浏览器中观看一些 Flow TV 吧。
那么,Veo 3 如何影响 AI 视频制作的现状?很明显,我们将看到比以往更多的深度伪造 (deepfakes),区分真实视频和 AI 视频将变得更加困难——正如您将在下面收集的示例中所见,一系列全新的 AI 视频创作成为可能。
人们正在创作什么
您不必费心寻找 Veo 3 应用的例子。也许谷歌自己的展示视频是一个不错的起点:您可以看到羽毛在空中飘浮,林中的动画角色,侦探审问一只橡皮鸭,以及一位小提琴家演奏音乐。
这些片段展示了 Veo 3 在视频质量和配套音频方面取得的一些飞跃。总的来说,音乐和对话与视频完美匹配,增强了整体效果——看起来确实像是真演员在说真台词。

然而,即使是谷歌精心挑选的片段也并非完美无瑕。物理现象常常显得怪异,而且我们无法得知最终结果与使用的文本提示的契合度有多高,因为它们并没有包含在内。创建逼真的 AI 视频是一回事,但要严格按照提供的文本说明来制作是另一回事。
最近在 Instagram 上走红的一个 Veo 3 系列是《帝国冲锋队员的 Vlog》,讲述了一个名叫格雷格的倒霉帝国冲锋队员的冒险经历。该系列在多个视频和多个场景中保持一致性方面做得非常巧妙——因为所有帝国冲锋队员看起来都一样——它再次展示了 Veo 3 所能实现的视频质量。

AI 视频生成器在制作街头采访视频(vox pop)方面也表现出色:例如,观看《纽约的无尽长队》这个片段。如果仔细观察,仍然会发现一些不一致和错误,但它仍然是YouTube上真实生活采访的令人信服的人工模仿。
这些 AI 采访看起来如此逼真,部分原因在于 Veo 3 已经对类似的视频进行了大量训练。请注意,摄像机角度几乎总是相同的,人物看起来也比较普通。当涉及到创建更奇特的内容时,Veo 3 的训练数据较少,能力也就没那么强。
如何使用 Veo 3
目前,您需要订阅每月高达 250 美元的 Google AI Ultra 套餐才能充分利用 Veo 3。对于普通用户和对 AI 感兴趣的人来说,这是一个很高的要求,但对于创意工作室或电影公司来说,这可能不算什么大开销。即便如此,仍有使用限制,尽管这些限制并未明确说明(限制通常取决于谷歌 AI 基础设施在特定时间的压力大小)。
如果您选择每月 20 美元的 Google AI Pro 套餐,您每天可以获得 3 个“Veo 3 Fast”积分。这是 Veo 3 的一个更快、质量较低、能耗较低的版本,尽管谷歌并没有详细说明 Veo 3 和 Veo 3 Fast 之间的区别。随着时间的推移,这些配额可能会发生变化。

AI Pro 或 AI Ultra 套餐的用户可以访问网络版 Gemini 开始制作视频(谷歌表示移动应用程序的访问仍在推出中,所以您也可能在那里看到它)。在屏幕底部的提示框中,点击 **Video** 告知应用程序您要生成视频,然后输入您想看到的描述。
请记住,您只有 8 秒的时间,因此无法包含太多场景指导和情节。请尽可能详细地说明摄像机角度和运动、场景中想要看到的内容以及音效。准备好后,点击右侧的箭头,AI 就会开始工作。

总的来说,在使用 Veo 3 制作视频时,越具体越好。任何您未提及的内容都将由 AI 发挥(而且它不总是会严格按照您的指示执行)。上面是我尝试创建一个夏季徒步场景的努力,结果还不错,除了中间有一个相当随机的剪辑。一旦您用完了 Veo 3 积分,您将回退到旧的 Veo 2 AI 模型。
总的来说,这些视频可能非常逼真,但它们仍然无法与真正的电影制作相提并论。仍然有太多不一致、物理问题以及对提示的偏离,更不用说通用输出的问题了,这意味着很多内容看起来都差不多。然而,毫无疑问,Veo 4 已经正在开发中了。