

人工智能自 20 世纪 50 年代 以来取得了长足的进步,并承担了令人印象深刻的各种任务。它能够解决 数学问题、检测 自然灾害、识别不同生物、驾驶船只 等等。但对于 谷歌 和 Meta 这样的科技巨头来说,他们的圣杯之一是创造出能够像人类一样理解语言的人工智能(这项追求有时也会伴随着自身的 冲突)。
语言模型的一项关键测试就是写作——这项工作对很多人来说也 颇有挑战。谷歌工程师设计了一个名为 Wordcraft 的概念验证实验,利用其语言模型 LaMDA 来写小说。该工具于两年前首次开发,距离成为面向公众的产品仍很遥远。
那么,Wordcraft 究竟是什么?它又能做什么? 谷歌将其描述为 “一个以故事创作为中心的 AI 驱动的文本编辑器”,它可以作为一种助手,帮助作者构思想法或克服写作障碍。为了评估 Wordcraft 在创作过程中的作用,谷歌招募了 13 位英语作家使用该工具来创作故事——以下是他们 创作的内容。
作家可以给 Wordcraft 提供诸如故事类型(例如悬疑)以及故事内容(例如渔民)等提示。他们还可以要求模型对自己的想法进行后续创作,描述特定场景,创建角色,重写短语使其更幽默或更悲伤,以及精炼或替换某些词语。Wordcraft 还可以响应更“自由形式的提示”,例如解释某人为什么会这样做。由于 LaMDA 是一个对话式 AI,Wordcraft 有一个聊天机器人,作家可以就他们想要故事如何发展进行沟通。(关于 Wordcraft 的更多控制信息,可以在该团队的 两篇 白皮书中 找到)。

这些模型从开放网络上学习了信息,作家可以尝试不同的指令来获得想要的结果。“作者们一致认为,‘凭空’产生想法的能力是与 AI 模型共同创作中最引人注目的部分之一。虽然这些模型在一致性和连贯性方面可能存在困难,但它们在发明细节和润色方面表现出色,”谷歌工程师在关于 Wordcraft 的 博客文章 中写道。
其中许多细节最终会非常超现实,因为模型缺乏对物理世界的直接了解。这更像是通过随机相关的互联网搜索来掷骰子。“例如,刘宇昆 要求模型‘给‘错误地认为 ATM 机里困着一个孩子’的综合征起个名字。’(模型给出的答案是‘幻影救援综合征’),”谷歌工程师在博客中指出。
[相关:研究人员使用 AI 来解释复杂的科学,结果好坏参半]。
在过去的几年里,人工智能已被用于撰写 剧本、戏剧、新闻文章、小说,甚至 科学论文。但这些模型仍然充满了 缺陷,并且在不断发展。它们仍然存在 风险,其中最大的风险之一是,尽管它们可以写出像人类一样能说的内容,但它们并不真正理解自己所说的内容。而且重要的是,它们目前还无法完全独立运行。
谷歌研究院高级研究总监 Douglas Eck 在最近一次以 AI 为主题的谷歌活动上指出,Wordcraft 可以增强故事,但不能写出完整的故事。目前,该工具专注于虚构写作,因为它在当前模式下可能会遗漏上下文或混淆细节。它只能根据前 500 个词生成新内容。
此外,许多作家抱怨 Wordcraft 的写作风格相当基础。它构造的句子往往简单、直接、单调。它无法真正模仿散文的风格或语调。而且由于模型倾向于网络上的无毒内容,它不愿意说刻薄的话,这实际上可能是一个缺点:有时为了制造冲突是需要这样做的。由于它是在互联网上训练的,它倾向于倾向于陈词滥调,这使得故事不够独特和原创。“例如,Nelly Garcia 指出了创作女同性恋爱情故事的困难——模型一直在建议她加入一个男性角色,或者让女性主角谈论友谊,”谷歌工程师写道。
Wordcraft 团队的研究员之一 Daphne Ippolito 建议,添加 参数高效微调,他们可以对其现有模型进行定制和实现,这有望帮助他们生成不同的写作风格,比如莎士比亚的风格。但它是否能够清晰地模仿两位维多利亚时代作家,如查尔斯·狄更斯和夏洛特·勃朗特之间的细微风格差异,还有待进一步探索。(有趣的是,Ippolito 曾参与一个名为 Real or Fake text 的独立项目,该项目要求用户区分 AI 和人类撰写的食谱、新闻文章和短篇故事。)
Ippolito 还表示,Wordcraft 可能不是最佳的作家助手模型。他们如何设计或修改 AI 可以根据作者需要的帮助类型而有所不同——无论是情节、角色、奇幻地理还是故事大纲。