谷歌正尝试教 AI 写小说 | Popular Science

人工智能自 20 世纪 50 年代以来取得了长足的进步，并承担了令人印象深刻的各种任务。它能够解决数学问题、检测自然灾害、识别不同生物、驾驶船只等等。但对于谷歌和 Meta 这样的科技巨头来说，他们的圣杯之一是创造出能够像人类一样理解语言的人工智能（这项追求有时也会伴随着自身的冲突）。

语言模型的一项关键测试就是写作——这项工作对很多人来说也颇有挑战。谷歌工程师设计了一个名为 Wordcraft 的概念验证实验，利用其语言模型 LaMDA 来写小说。该工具于两年前首次开发，距离成为面向公众的产品仍很遥远。

那么，Wordcraft 究竟是什么？它又能做什么？谷歌将其描述为 “一个以故事创作为中心的 AI 驱动的文本编辑器”，它可以作为一种助手，帮助作者构思想法或克服写作障碍。为了评估 Wordcraft 在创作过程中的作用，谷歌招募了 13 位英语作家使用该工具来创作故事——以下是他们创作的内容。

作家可以给 Wordcraft 提供诸如故事类型（例如悬疑）以及故事内容（例如渔民）等提示。他们还可以要求模型对自己的想法进行后续创作，描述特定场景，创建角色，重写短语使其更幽默或更悲伤，以及精炼或替换某些词语。Wordcraft 还可以响应更“自由形式的提示”，例如解释某人为什么会这样做。由于 LaMDA 是一个对话式 AI，Wordcraft 有一个聊天机器人，作家可以就他们想要故事如何发展进行沟通。（关于 Wordcraft 的更多控制信息，可以在该团队的两篇白皮书中找到）。

这些模型从开放网络上学习了信息，作家可以尝试不同的指令来获得想要的结果。“作者们一致认为，‘凭空’产生想法的能力是与 AI 模型共同创作中最引人注目的部分之一。虽然这些模型在一致性和连贯性方面可能存在困难，但它们在发明细节和润色方面表现出色，”谷歌工程师在关于 Wordcraft 的博客文章中写道。

其中许多细节最终会非常超现实，因为模型缺乏对物理世界的直接了解。这更像是通过随机相关的互联网搜索来掷骰子。“例如，刘宇昆要求模型‘给‘错误地认为 ATM 机里困着一个孩子’的综合征起个名字。’（模型给出的答案是‘幻影救援综合征’），”谷歌工程师在博客中指出。

[相关：研究人员使用 AI 来解释复杂的科学，结果好坏参半]。

在过去的几年里，人工智能已被用于撰写剧本、戏剧、新闻文章、小说，甚至科学论文。但这些模型仍然充满了缺陷，并且在不断发展。它们仍然存在风险，其中最大的风险之一是，尽管它们可以写出像人类一样能说的内容，但它们并不真正理解自己所说的内容。而且重要的是，它们目前还无法完全独立运行。

谷歌研究院高级研究总监 Douglas Eck 在最近一次以 AI 为主题的谷歌活动上指出，Wordcraft 可以增强故事，但不能写出完整的故事。目前，该工具专注于虚构写作，因为它在当前模式下可能会遗漏上下文或混淆细节。它只能根据前 500 个词生成新内容。

此外，许多作家抱怨 Wordcraft 的写作风格相当基础。它构造的句子往往简单、直接、单调。它无法真正模仿散文的风格或语调。而且由于模型倾向于网络上的无毒内容，它不愿意说刻薄的话，这实际上可能是一个缺点：有时为了制造冲突是需要这样做的。由于它是在互联网上训练的，它倾向于倾向于陈词滥调，这使得故事不够独特和原创。“例如，Nelly Garcia 指出了创作女同性恋爱情故事的困难——模型一直在建议她加入一个男性角色，或者让女性主角谈论友谊，”谷歌工程师写道。

Wordcraft 团队的研究员之一 Daphne Ippolito 建议，添加参数高效微调，他们可以对其现有模型进行定制和实现，这有望帮助他们生成不同的写作风格，比如莎士比亚的风格。但它是否能够清晰地模仿两位维多利亚时代作家，如查尔斯·狄更斯和夏洛特·勃朗特之间的细微风格差异，还有待进一步探索。（有趣的是，Ippolito 曾参与一个名为 Real or Fake text 的独立项目，该项目要求用户区分 AI 和人类撰写的食谱、新闻文章和短篇故事。）

Ippolito 还表示，Wordcraft 可能不是最佳的作家助手模型。他们如何设计或修改 AI 可以根据作者需要的帮助类型而有所不同——无论是情节、角色、奇幻地理还是故事大纲。