由人工智能生成的描绘人类的深度伪造视频,正变得越来越先进,也越来越普遍。最先进的工具现在可以生成被普通人类观察者无法区分的篡改内容。深度伪造检测器使用自己的人工智能模型来分析视频片段,试图通过寻找隐藏的线索来绕过这种欺骗。其中一个线索就是人类脉搏的存在。过去,检测到明显脉搏或心率的人工智能模型可以自信地将这些片段归类为真实的。但情况可能不再是这样了。
柏林洪堡大学的研究人员本周在《成像前沿》(Frontiers in Imaging)期刊上发表了一项研究,他们创建了看似显示类人脉搏的深度伪造视频。那些以脉搏作为真实性标记进行训练的深度伪造检测器,错误地将这些篡改的视频归类为真实的。研究结果表明,心率和脉搏——曾被认为是相对可靠的真实性指标——可能不再能抵挡最先进的生成式人工智能深度伪造模型。换句话说,深度伪造创造者和检测器之间的持续猫鼠游戏,可能正朝着欺骗者倾斜。
柏林洪堡大学教授、该研究的通讯作者Peter Eisert在一份声明中说:“我们首次证明,近期高质量的深度伪造视频可以呈现出逼真的心跳和面部细微的颜色变化,这使得它们更难被检测到。”
深度伪造是如何工作的以及为什么它们很危险
“深度伪造”(Deepfake)一词广泛地指的是一种人工智能技术,它使用深度学习来操纵媒体文件。深度伪造可以用来生成具有不同逼真程度的图像、视频和音频。虽然有些用途可能相对无害,但该技术因助长了非自愿性色情图像的激增而迅速臭名昭著。一位在2023年接受《连线》(Wired)杂志采访的独立研究者估计,在短短七天内,就有大约244,625个被篡改的视频被上传到排名前35位的深度伪造色情网站。最近流行的所谓“nudify”智能手机应用程序进一步加剧了这个问题,让没有技术专长的人只需点击一下按钮,就能将某人的脸部插入色情图像中。

人们还对其他形式的深度伪造表示担忧,特别是音频和视频版本,它们被用来欺骗人们上当受骗,遭受金融诈骗。另一些人担心该技术可能被用来创建令人信服的政客和其他有权势人物的复制品,以传播虚假信息。已经出现描绘总统巴拉克·奥巴马和唐纳德·特朗普等众多公众人物的深度伪造。国会本周刚刚通过了一项有争议的新法案,名为“立即取缔法”(Take It Down Act),将非法化发布和分享非自愿性色情图像,包括使用人工智能生成的图像。
相关:[传播人工智能生成内容可能导致高额罚款]
深度伪造检测器如何扫描视频以检测脉搏
但任何有意义地打击深度伪造的努力都需要一个强大的系统来准确地区分它们和真实材料。过去,深度伪造视频即使对普通观众来说也常常是可识别的,因为它们包含了一些标志性迹象——或“伪影”——例如不自然的眼睑运动或面部边缘的扭曲。然而,随着深度伪造人工智能模型的进步和改进,研究人员不得不开发更复杂的方法来识别伪造品。自2020年至少以来,一种这样的技术就涉及使用远程光电容积描记法(rPPG)——一种最以其在远程医疗中测量人类生命体征的应用而闻名——来检测脉搏迹象。直到现在,人们普遍认为,即使是令人信服的人工智能生成的人类图像,也不会表现出可检测到的脉搏。
柏林洪堡大学的研究人员想看看,当用最新的深度伪造技术进行测试时,这些假设是否仍然成立。为了检验他们的假设,他们首先开发了一个专门用于分析视频以检测心率和脉搏迹象的深度伪造检测系统。他们使用从人类参与者收集的视频数据对其进行训练,要求他们进行一系列活动,如交谈、阅读和与录音监督员互动,所有这些活动都会产生不同的面部表情。研究人员发现,在仅接受10秒视频数据训练后,他们的模型就能准确识别出个体的心率。
在设定了基线后,研究人员再次重复了测试,这次使用的是同一批人类参与者的人工智能生成视频。他们总共创建了32个深度伪造视频,所有这些视频在人类眼中看起来都非常真实。尽管研究人员期望这些被篡改的视频会因为缺乏脉搏而被检测器标记出来,但结果却恰恰相反。检测器检测到了本不应存在的“心跳”,并错误地得出结论,这些视频描绘的是真实的人类。
研究人员写道:“我们的实验表明,深度伪造可以表现出逼真的心率,这与之前的发现相悖。”
检测器可能需要适应新的现实
研究人员表示,这些发现揭示了现代深度伪造检测器中一个可能被恶意行为者利用的潜在漏洞。他们指出,理论上,深度伪造生成器可以“插入”心跳迹象到被篡改的视频中,以欺骗检测系统。不过,值得注意的是,在本研究中并非如此。相反,这些深度伪造视频似乎“继承”了它们所基于的原始视频的心跳信号。这种继承是如何发生的,目前尚不清楚。论文中的一个图显示了原始人类视频和深度伪造视频的热图,它们在皮肤和血管中光线传输方面显示出相似的变化。其中一些变化,研究中称之为“信号痕迹”,几乎是相同的,这表明它们是从原始视频传递到新的深度伪造视频中的。所有这些都表明,更先进的模型能够在其伪造品中复制那些细微的感受,而这是几年前的深度伪造工具所无法实现的。

Eisert说:“真实人物肤色上的细微变化会与面部运动一起转移到深度伪造视频中,这样原始的脉搏就会在假视频中被复制。”
这些结果虽然意义重大,但并不一定意味着有效减轻深度伪造的努力是徒劳的。研究人员指出,尽管当今先进的深度伪造工具可以模拟逼真的心跳,但它们在空间和时间上仍然不能持续地描绘出面部血流的自然变化。此外,一些商业深度伪造检测器已经在使用更精细的指标——例如测量像素亮度的变化——这些指标根本不依赖于生理特征。Adobe和Google等大型科技公司也在为图像和视频开发数字水印系统,以帮助追踪内容是否被人工智能篡改。尽管如此,本周的研究结果强调了深度伪造技术的快速发展意味着,那些致力于检测深度伪造技术的人不能长期依赖任何单一方法。