聊天机器人真的通过了图灵测试吗?

httpswww.popsci.comsitespopsci.comfilesimport2014turing_0.jpg
©Maki Naro

提示:没有。但它确实赢得了一场比赛!

此时此刻,你们一定都被 Eugene Goostman 的个人魅力所折服。这是一款 聊天机器人,当它在 雷丁大学 举办的2014年图灵测试中,说服了30名评委中的10名,让他们相信它是人类时,便成为了新闻。至此,每家有能力写下两百字新闻的媒体都争相将 Eugene Goostman 称为“机器人之王”。但我们应该早就明白,事情并非如此。

1950年,英国数学家兼密码分析学家艾伦·图灵提出了一个测试,旨在判断机器是否能与人类无法区分。这项测试被迅速命名为图灵测试,而通过测试则是人工智能的圣杯。你可以把它想象成《银翼杀手》中的Voight-Kampff测试。只不过,最后你不是射杀复制人。目前,图灵测试的进行方式是:人类评委坐在电脑前,与一个看不见的对话者进行文字交流。由于无法看到对方,评委必须根据对话线索来判断对方是人类还是机器。图灵曾预言,到2000年,一个计算机程序将能说服30%的人,让他们相信它是人类。比赛组织者就采用了这一预测——尽管图灵从未为图灵测试设定过具体的指导方针,因此这一预测在一定程度上被断章取义了——来设定图灵测试的获胜条件。

在大量用户涌入导致服务器崩溃之前,我有机会与 Goostman 进行了对话。尽管 Oz (一位评论员)的批评严厉(他有时会 过度 评价),我必须如实报告,他的表现不错。远非完美,但也不算差。Goostman 犯了以往的聊天机器人都犯过的错误:他回避问题,他转移话题,他给出含糊的回答,他会以一种正常人不会有的、试图表现出他在认真听话的方式重复你的话,当然,他还说过一些非常愚蠢、毫无意义的话。Goostman 的创造者通过给他设定一个虚构的背景故事来解释他的怪癖。你看,Eugene 是一个13岁的乌克兰男孩。他有喜欢的食物,还有一只宠物豚鼠,而且他会因为觉得没关系而打断重要的审问来告诉你这些。我早就把他当成复制人射杀了。

顺便说一句,我不相信这些。第一,这对13岁的孩子不公平,他们中的许多人可以在不诉诸于不合逻辑的陈述的情况下进行对话。同样,这也是对说英语作为第二语言的人的一种侮辱,原因相同。Goostman 的背景只是一个借口,但这并非第一次有人利用一些社交工程手段来弥补机器人的不足。臭名昭著的 MGONZ 程序曾让一位可怜的家伙(与它)纠缠了90分钟。它的伎俩是什么?MGONZ 具有对抗性、粗俗且侮辱人。当你测试 MGONZ 时,你脑海中响起的任何警报都会被归因于一个粗鲁家伙的行为举止,而不是一台电脑。绕过你大脑的 精神病检测器 是一个巧妙的技巧,而且比外国青少年这段戏码有趣多了。

Eugene Goostman 没有通过图灵测试。他赢得了雷丁大学的比赛。他在图灵预测的14年后达到了图灵的基准。但它绝不是一个完美的人工智能,我们还有很长的路要走,并且在这个过程中还有很多东西要学。我并不认为评委们是傻瓜。但我希望他们之后觉得有些傻。

 

更多优惠、评测和购买指南

 
Maki Naro 是一位艺术家和科学传播者。自2010年以来,他一直在持续创作一系列他称之为“科学的粉丝艺术”的作品。

© .