像 ChatGPT 这样的人工智能聊天机器人的逻辑出乎意料地简单

聊天机器人可能看起来像复杂的对话者,回应方式像真人一样。但如果你仔细观察,它们本质上是一个高级程序版本,通过预测下一个最可能的词来完成你的句子。Bard、ChatGPT 和其他人工智能技术都是大型语言模型——一种算法,通过类似小学测验中“填空题”的练习进行训练。更简单地说,它们是由人类编写的指令,告诉计算机如何解决问题或进行计算。在这种情况下,算法会利用你的提示和你遇到的任何句子来自动完成答案。

像 ChatGPT 这样的系统只能使用它们从网络上获得的信息。“它所做的就是利用它能够访问的互联网,然后填补接下来会发生什么,”卡内基梅隆大学机器学习系的教授 Rayid Ghani 说。 

让我们假设你将这句话输入到人工智能聊天机器人中:“猫坐在____上。”首先,语言模型需要知道缺失的词语必须是名词,在语法上才说得通。但它也不能是任何名词——例如,猫不能坐在“民主”上。所以算法会浏览人类写下的文本,来了解猫实际上会坐在什么上面,并选出最有可能的答案。在这种情况下,它可能会认为猫坐在“笔记本电脑”上的几率为 10%,坐在“桌子”上的几率为 20%,坐在“椅子”上的几率为 70%。然后模型会选择最有可能的答案:“椅子”。

该系统能够利用这种预测过程来用完整的句子回应。如果你问聊天机器人“你怎么样?”,它会根据问题中的“你”生成“我”,然后根据网络上大多数人在被问到“怎么样”时的回应生成“很好”。

这些程序处理信息并做出决策的方式在某种程度上类似于人脑的运作方式。“这项任务(预测最有可能的回应)虽然简单,但实际上需要对语言如何运作以及世界如何运作有极其深刻的了解,”麻省理工学院计算机科学与人工智能实验室的研究员 Yoon Kim 说。“你可以把(聊天机器人)看作是带有微调旋钮的算法。这些旋钮基本上是通过你在现实世界中看到的数据来学习的,”从而使软件能够创建“整个英语词汇的概率”。

语言模型的美妙之处在于,研究人员不必为它们设定严格的规则或语法。人工智能聊天机器人通过消费“token”(从书籍、文章和网站的原始文本中提取的常见字符序列)来隐式地学习如何形成有意义的句子。它只需要找到特定词语或短语之间的模式和关联。 

但这些工具经常会吐出不精确或不正确的答案——部分原因是它们的学习方式。“语言模型是在虚构和非虚构作品中进行训练的。它们是在互联网上所有文本中进行训练的,”Kim 说。如果 MoonPie 在推特上说它的饼干真的来自月球,ChatGPT 可能会在一篇关于该产品的文章中纳入这一点。如果 Bard 在扫描了这篇文章后得出猫坐在民主上的结论,那么你可能得更习惯这个想法了。

阅读更多关于人工智能时代的生命

或者查看我们的所有 PopSci+ 文章。

 

更多优惠、评测和购买指南

 
Charlotte Hu Avatar

Charlotte Hu

助理科技编辑

Charlotte 是《趣味科学》的助理科技编辑。她对了解我们与技术的关系如何变化以及我们如何在网上生活感兴趣。


© .