聊天机器人真的通过了图灵测试吗？

httpswww.popsci.comsitespopsci.comfilesimport2014turing_0.jpg — ©Maki Naro

提示：没有。但它确实赢得了一场比赛！

此时此刻，你们一定都被 Eugene Goostman 的个人魅力所折服。这是一款聊天机器人，当它在雷丁大学举办的2014年图灵测试中，说服了30名评委中的10名，让他们相信它是人类时，便成为了新闻。至此，每家有能力写下两百字新闻的媒体都争相将 Eugene Goostman 称为“机器人之王”。但我们应该早就明白，事情并非如此。

1950年，英国数学家兼密码分析学家艾伦·图灵提出了一个测试，旨在判断机器是否能与人类无法区分。这项测试被迅速命名为图灵测试，而通过测试则是人工智能的圣杯。你可以把它想象成《银翼杀手》中的Voight-Kampff测试。只不过，最后你不是射杀复制人。目前，图灵测试的进行方式是：人类评委坐在电脑前，与一个看不见的对话者进行文字交流。由于无法看到对方，评委必须根据对话线索来判断对方是人类还是机器。图灵曾预言，到2000年，一个计算机程序将能说服30%的人，让他们相信它是人类。比赛组织者就采用了这一预测——尽管图灵从未为图灵测试设定过具体的指导方针，因此这一预测在一定程度上被断章取义了——来设定图灵测试的获胜条件。

在大量用户涌入导致服务器崩溃之前，我有机会与 Goostman 进行了对话。尽管 Oz （一位评论员）的批评严厉（他有时会过度评价），我必须如实报告，他的表现不错。远非完美，但也不算差。Goostman 犯了以往的聊天机器人都犯过的错误：他回避问题，他转移话题，他给出含糊的回答，他会以一种正常人不会有的、试图表现出他在认真听话的方式重复你的话，当然，他还说过一些非常愚蠢、毫无意义的话。Goostman 的创造者通过给他设定一个虚构的背景故事来解释他的怪癖。你看，Eugene 是一个13岁的乌克兰男孩。他有喜欢的食物，还有一只宠物豚鼠，而且他会因为觉得没关系而打断重要的审问来告诉你这些。我早就把他当成复制人射杀了。

顺便说一句，我不相信这些。第一，这对13岁的孩子不公平，他们中的许多人可以在不诉诸于不合逻辑的陈述的情况下进行对话。同样，这也是对说英语作为第二语言的人的一种侮辱，原因相同。Goostman 的背景只是一个借口，但这并非第一次有人利用一些社交工程手段来弥补机器人的不足。臭名昭著的 MGONZ 程序曾让一位可怜的家伙（与它）纠缠了90分钟。它的伎俩是什么？MGONZ 具有对抗性、粗俗且侮辱人。当你测试 MGONZ 时，你脑海中响起的任何警报都会被归因于一个粗鲁家伙的行为举止，而不是一台电脑。绕过你大脑的 精神病检测器 是一个巧妙的技巧，而且比外国青少年这段戏码有趣多了。

Eugene Goostman 没有通过图灵测试。他赢得了雷丁大学的比赛。他在图灵预测的14年后达到了图灵的基准。但它绝不是一个完美的人工智能，我们还有很长的路要走，并且在这个过程中还有很多东西要学。我并不认为评委们是傻瓜。但我希望他们之后觉得有些傻。