

Instagram 的母公司、马克·扎克伯格旗下的科技巨头 Meta 上个月出人意料地宣布了一个消息,让该平台约 12 亿全球用户感到震惊。Meta 表示,其 AI 图像生成器正在使用用户上传到公司平台的图片,包括原创艺术作品和其他创意资产。Meta 高管 Chris Cox 上个月在接受《彭博社》采访时首次公开了这一消息,此举引发了一些创作者的强烈反对。截至撰稿时,已有超过 13 万名 Instagram 用户在 Instagram 上转发了一条消息,告知该公司他们不同意 Meta 使用他们的数据来训练其 AI。然而,这些呼吁是基于对创作者与数据提取式社交媒体平台之间关系的根本性误解。这些创作者,无论他们是否意识到,都已经放弃了他们的作品。
创作者呼吁 Meta 停止使用“受版权保护的作品”训练模型
这条病毒式传播的 Instagram 消息是通过一个模板实现的——用户可以复制预制的帖子到自己的 Stories 中,并配以可自定义的背景。这些帖子都包含相同的文字内容,观看者可以看到大约五秒钟。该模板由众多数字艺术家、摄影师和其他创作者分享,内容如下:
“我拥有上传到我 Instagram 个人资料的所有图片和帖子的版权,因此不同意 Meta 或其他公司使用它们来训练生成式 AI 平台。这包括所有未来和过去的帖子。
@Instagram 撤销 AI 程序。”
尽管创作者的抱怨是可以理解的,但它们 nonetheless 表明了对社交媒体经济运作方式的严重缺乏理解。创作者是否真的拥有上传到 Instagram 的作品的版权?答案是一个大大的“不”。
Instagram 的服务条款声称该平台不“主张用户内容的所有权”。但虽然它不拥有版权,但所有 Instagram 用户在注册服务时就已经授予了公司使用其作品的许可。换句话说,一旦图片或视频上传到 Instagram,Meta 就可以自由修改、复制或创作该内容的衍生作品。事实证明,这种广泛的授权现在包括使用内容来训练 AI 模型。
需要明确的是,发布一条告诉社交平台你不同意其数据政策的帖子并不会产生任何实质性影响。十多年前,一群 Facebook 用户曾短暂尝试过类似的策略,结果同样毫无用处。
关于使用用户数据训练 AI 模型,“我们不使用私人数据,我们不使用人们与朋友分享的数据。我们使用公开的数据,” Meta 产品总监 Chris Cox 在 #BloombergTech 上表示。 pic.twitter.com/FC0SWlTgqY
— Bloomberg Live (@BloombergLive) 2024 年 5 月 9 日
德克萨斯农工大学法学和传播学教授 Peter K. Yu 告诉《科学美国人》:“虽然 Instagram 账户所有者保留其发布内容的版权,但通过使用该平台,他们已授予 Meta 许可,服务条款明确规定,他们授予的许可是非独占的、免版税的、可转让的、可转授的、全球性的。”“但是,这项许可将在内容被删除时终止。”
Yu 补充说,一些拥有更强在线数据隐私法的司法管辖区,例如欧盟,可能会对个人图像提供隐私保护,但这在美国是至关重要的不同。同样,美国某些州提供“肖像权”,保护个人免受对其姓名、肖像、形象、声音或其他个人属性的未经授权的商业使用,但 Yu 指出,这种保护措施侧重于商业用途,因此对于其数据被抓取以训练模型以供 Instagram 用户而言,可能几乎没有保护作用。
Meta 如何训练其 AI
Meta 和其他构建生成式 AI 工具的技术公司(如 OpenAI 和 Google)一样,已经积累了大量的文本、图像、音频和视频数据库来训练其系统。这些数据包括数十亿个网页、数字书籍和多年来在网络上分享的多媒体文件。在接受《彭博社》采访时,Cox 澄清说,这个训练数据宝库也吸纳了 Instagram 上的公开帖子,包括用户的图片、视频以及公开评论和标题。Cox 表示,公司(至少目前)不会使用明确的私人数据(如直接消息或私人账户的内容)来训练其模型。Meta 在上个月发布的一篇博客文章中阐述了其 AI 训练的更新方法。
Meta 发言人告诉《科学美国人》:“随着我们推出 AI 体验,我们分享了有关我们用于构建和改进 AI 体验的信息类型——这包括来自 Instagram 和 Facebook 的公开帖子,这符合我们的隐私政策和服务条款。”“由于没有 AI 模型是完美的,反馈对于 AI 的持续发展至关重要,我们正在与专家、政策制定者和倡导者合作,以负责任地构建 AI。”
如果过去有任何指导意义,那么公开的 Instagram 帖子可能会为 Meta 的 AI 图像生成器提供显著的输出。去年 Meta 发布其 Facebook AI 聊天机器人助手时,Meta 全球事务总裁 Nick Clegg 告诉《路透社》,为这些 AI 工具提供动力的培训数据的“绝大部分”——您猜对了——来自公开的 Facebook 和 Instagram 帖子。Meta 远非唯一一家使用 AI 生成图像的公司,但它是少数几家拥有数亿忠实用户,他们定期免费将其数据丰富照片和视频上传到其平台上的公司之一。这种利用其用户群的能力可能会给 Meta 带来竞争优势。
Meta 平台上的创作者对该公司看似新近的利用他们的账户作为 AI 素材的兴趣并不满意。除了上述帖子外,一些用户甚至采取了更进一步的行动,威胁如果公司继续目前的道路就完全离开平台。虽然用户实际上无法撤销注册平台时授予 Meta 的同意,但一些用户仍然将创作者的强烈反对辩护为集体表达不满的方式。
“警告人们在这款应用上艺术家被剥夺了哪些权利,这并非危言耸听,”一位分享该模板的用户本周在她的 Stories 中写道。“AI 已经融入了企业和公众的使用,我们至少应该对此表示一点抵抗,对吗?”
艺术家正在起诉生成式 AI 公司
如果这一切听起来很熟悉,那可能是因为这并不是视觉艺术家尤其第一次对 AI 公司表达不满。去年,包括插画师 Sarah Andersen、Kelly McKernan 和 Karla Ortiz 在内的一群专业视觉艺术家起诉 Stability、Midjourney 和 DeviantArt,声称他们的 AI 模型非法生成了与他们受版权保护的作品异常相似的图像。这些艺术家中的几位公开表达了他们的震惊和沮丧,当 AI 工具在被提示以“风格为”他们的名字创作图像时,会产生与他们作品惊人相似的作品。
负责此案的法官不认为 AI 生成器输出(其生成的图像)确实侵犯版权,因为它们不是完全相同的副本。尽管如此,艺术家们仍被允许就部分诉讼进行追究,这些诉讼声称这些公司在未经许可的情况下,在用他们的作品训练模型时侵犯了他们的版权。但即使这些艺术家最终在法律诉讼中获胜,这很可能对在 Instagram 上对 Meta 鸣不平的艺术家影响甚微。在前一种情况下,艺术家声称 AI 公司非法抓取了他们未同意的非公开来源的作品,侵犯了版权。不幸的是,对于在 Instagram 上分享作品的艺术家来说,他们确实在技术上授予了 Meta 抓取他们作品的同意,无论他们当时是否意识到。
Instagram 艺术家实际上能做些什么来保护他们的作品免受 AI 的侵害?
Meta 发布了几款工具,让用户能够更好地控制 AI 如何访问他们的数据,但效果仍然有限。例如,去年 Meta 在其帮助中心添加了一个名为“生成式 AI 数据主体权利”的新版块,允许用户请求甚至要求删除 Meta AI 模型使用的关于他们的第三方数据。理论上,该工具允许用户尝试退出 Meta 使用其从其他网站抓取的作品来训练其模型。这包括从博客、网站或书籍中提取的图片。然而,这个退出选项特别不适用于直接在 Instagram 或其他 Meta 拥有的产品上共享的材料。在这种情况下,这些材料将被视为第一方数据。
最近,该公司发布了一份单独的表格,用户可以在其中正式“反对”使用他们的数据来训练其 AI。在这里,用户可以提供他们的电子邮件地址、居住国家以及解释为什么他们认为 Meta 不应该抓取他们的图片。值得注意的是,尽管 Meta 表示将审查这些请求,但它也表示它仍可能选择处理用户的信息并将其用于训练 AI。当然,用户可以通过将账户设为私有来限制 Meta 训练其数据的能力,但这对于许多艺术家和创作者来说是不现实的选择,因为他们将内容发布到平台上的主要目的是吸引受众。这种方法也不适用于旧的公开帖子,Meta 可能已经抓取了这些数据用于训练。
Meta 发言人表示:“虽然我们目前没有退出功能,但我们构建了平台内工具,允许用户删除我们在各应用程序中与 Meta AI 聊天中的个人信息。”“根据人们居住的地点,他们还可以根据当地隐私法反对使用他们的个人信息来构建和训练 AI。
在线提供同意已变得更加复杂且意义不大
用户对谁可以公开使用 Instagram 帖子的明显困惑,反映了现代互联网一个更大、日益严重的问题。“同意”在通常理解的意义上,已经变得越来越难以定义。康奈尔技术大学教授兼技术哲学家 Helen Nissenbaum 在最近接受《哈佛商业评论》采访时详细阐述了这一点,她表示,冗长晦涩的服务条款协议和不透明的数据隐私实践相结合,使得普通互联网用户不确定他们究竟提供了什么同意。事实上,根据 2017 年德勤的一项调查,91% 的美国消费者在从未完全阅读过服务条款协议的情况下同意了其中的内容。
Nissenbaum 在接受《哈佛商业评论》采访时表示:“人们普遍认为同意仍然是尊重人们隐私的基础。”“在某些情况下,是的,同意至关重要。但我们今天所拥有的并非真正的同意。”