机器对阵米特·罗姆尼:人工智能如何解析政治言论

撇开那些数量庞大且效果不佳的笑话不谈,政客本身并没有什么本质上的不好。诚然,他们是骗子,但这恰恰证明了他们是人类。政治本身也没有什么固有的缺陷。大声而效率低下地争论不休,这是一种值得骄傲的灵长类传统,其替代选项就是挥拳相向(或采取更致命的手段)。

政治令人不安之处在于其赤裸裸的说服力。人们被雇佣来撰写和发表旨在左右舆论的演讲,其语言似乎能根据需要而变化,以迎合不同的地区和选区。报道政治敏感问题的记者在为其特定立场发表激动人心的陈词,或者假装客观地只呈现事实却故意遗漏其他细节时,也会引起同样的担忧。这一切都是说服,而这可能是可怕的,因为我们天生就容易被说服。这是作为社会性动物的代价。

对我们来说幸运的是,机器并不那么容易被左右。去年,卡内基梅隆大学和北卡罗来纳大学教堂山分校的研究人员nasmith/papers/sim+acree+gross+smith.emnlp13.pdf/”>发表了一篇论文,展示了如何利用人工智能来剖析竞选演讲,量化候选人如何调整语言来吸引不同类型的选民。“当人们竞选美国总统时,有一种传统的看法是,一旦你,米特·罗姆尼,或者你,巴拉克·奥巴马,赢得了初选,你就会改变向公众展示自己的方式,然后转向中间派,”卡内基梅隆大学的计算机科学家诺亚·史密斯说。

为了检验这一假设,史密斯和他的演讲分析团队首先利用机器学习算法分析了112本非虚构政治书籍和765期杂志,识别出与特定政治意识形态最常关联的特定术语或“线索”。史密斯说,罗恩·保罗的书是“自由主义语言的一个绝佳例子”,尽管他的政治学家同事仍然需要仔细标注特定的章节,以帮助系统理解它所阅读和提取的内容。语言可以被标记为从极右到极左,自由主义或宗教,或者以上所有。在收集了超过3200万个线索后,该团队将一个名为CLIP(线索滞后意识形态比例)的计算机模型分配了这项令人不悦的任务,即筛选与2008年和2012年总统竞选相关的演讲稿,并确定这些政治线索的频率和关系。

史密斯说:“我们得出了一个相当清晰的图景,是的,在我们测试的每一个案例中,赢得了初选的人的语言都从更极端的立场转向了中间派。“这是一种人们相信但尚未经过实证检验的既成事实。”

你可以自行阅读结果,这些结果可能难以被置于恰当的语境中,因为这是一种基于人工智能的统计分析,不仅在于一个短语出现的次数,还在于它在演讲中的位置,以及它与其他线索的接近程度。此外,正如史密斯承认的那样,这个项目证实了一个普遍存在的看法,因此没有真正的惊喜。尽管如此,从CLIP的结果来看,将毫无感情的机器用于竞选演讲辞似乎具有真正的价值。

2011年9月,在2012年初选季开始时,米特·罗姆尼在佛罗里达州坦帕发表了一次演讲,根据CLIP的分析,该演讲充斥着右翼的线索。例如,它包含了与非法移民相关的各种术语。这是一个非常粗略的简化,但该模型似乎将这次演讲的倾向度定为约68%的右倾。不到一年后,他又回到坦帕接受共和党提名。但随着全国观众在电视上观看,以及大选的正式启动,任何关于移民的提及都消失了。CLIP实际上将这次演讲评估为左倾(约54%的政治相关语言都指向那个方向)。

在2008年的竞选中,巴拉克·奥巴马也表现出了类似的言辞变化,从初选前约59%的左倾语言,转变为在大选中约53%的右倾线索。因此,奥巴马不仅显然遵循了旨在走向中间派的经典假设策略,而且还过度偏向了红州议题,以更好地吸引保守派。这是故意的,还是对对手竞选方式的自然反应?无论原因如何,机器似乎捕捉到了评论员们错失的东西。

* * *

CLIP的创建者们的目标不是要指责特定的政客或策略,而是要证明这种人工智能驱动的分析可以很有用。史密斯说:“这是一个人们可能不太擅长的绝佳例子。“你我很难听到一次演讲,然后冷酷、客观地评估他们试图在多大程度上吸引特定选区。我们太主观了,也太纠结于问题本身了。我们在乎得太多了。”

CLIP对言辞的评估揭示了自然语言处理(NLP)的一个更复杂的益处,NLP是人工智能研究的一个分支,专注于分析口语或书面文本。NLP最著名的拥护者是IBM的沃森,它处理数百万页文档的能力使其在2011年赢得了《危险边缘》节目的冠军。现在,该平台已被用于广泛的文本处理应用,其中最引人注目的包括分析医学期刊和患者记录,以协助医生为特定的癌症患者识别相关的治疗方法和临床试验。NLP也是苹果Siri的人工智能基础,Siri是一个理论上功能强大的语音识别系统,在iPhone广告中的作用远大于在现实生活中的作用。

但沃森和Siri提供的,是NLP多年来一直提供的东西,也是计算机几十年来一直具备的能力——快速处理大量数据的能力。然而,CLIP通过处理我们可能不会信任人类来审查的数据,并将偏见注入结果,从而进入了更深远的领域。无论一个人可能声称对政治了解多少,特定的政客总是会引起强烈的情感反应。“计算机完全没有切身利益,”史密斯说。“它对米特·罗姆尼应该怎么说话没有任何立场。”

作为一种政治工具,或者说是一种揭露演讲稿撰写人和竞选经理滑头策略的反政治工具,NLP似乎相对强大。但在更广泛的人工智能背景下,像CLIP这样的系统驳斥了NLP最吸引人的地方在于模仿人类思维的观点。CLIP之所以有效,是因为它对米特·罗姆尼的宗教背景或巴拉克·奥巴马2008年的竞选承诺没有任何意见。CLIP以及类似的人工智能应用之所以有效,是因为它们能够处理人类语言,同时保持非人类和超然的态度。

CLIP在即将到来的选举中的作用尚不明确,可能也无关紧要。史密斯和他的同事是学者,而不是政治操盘手或创业公司创始人。由于他们的研究方法和数据是公开的,有兴趣采用它们的人可以轻松地创建自己的模型。但史密斯的后续项目可能对人工智能在政治中的应用产生更广泛的影响。史密斯再次与北卡罗来纳大学教堂山分校以及加州大学戴维斯分校和马里兰大学的研究人员合作,正在研究媒体对政治问题的“框架”问题。

一言以蔽之,框架就是选择。它指的是一个问题的呈现方式,即包含和强调的语言和参考类型,以及缺失的内容。例如,一篇关于移民的文章是讨论被遗弃的儿童和因驱逐而家庭破裂的情况,还是关注安全和执法问题?

现有研究似乎表明,框架是真实存在的,而且有时是违反直觉的。1993年的一项研究发现,阅读关于贫困的、侧重于全国失业率的报道的人,更有可能认为大机构应负有责任。与此同时,详细描述个人贫困状况的报道更有可能导致读者将经济困难归咎于个人决定。换句话说,以人为本的故事可能会适得其反,引起与同情相反的情感。更奇怪的是,有人曾推测框架具有传染性。一家媒体的选择可能会蔓延到其他媒体,而围绕特定问题的更广泛的政策辩论可能会跨越州界,并保留特定的框架。我们的国家辩论可能与事实本身一样,取决于语言的选择。史密斯说:“框架似乎真的很重要,所以它似乎是值得追踪的事情。”

在国家科学基金会的资助下,史密斯和他的团队nasmith/papers/boydstun+card+gross+resnik+smith.apsa14.pdf/”>目前正在创建他们称之为“政策框架代码簿”的项目,重点关注与同性婚姻、吸烟和移民相关的框架。到目前为止,他们已经收集了1990年至2012年间发布的约9500篇文章的框架数据,这是一个艰苦的、完全由人工完成的过程,但该团队认为未来可以实现自动化。这个为期三年项目已经进行了两年,现在得出许多结论还为时过早。唯一可以确定的是,这仅仅是开始。人工智能变得越先进、越容易获得,政客、记者和其他专业说客就必须越清楚自己所说的话以及如何说。

我个人非常欢迎我们那群过度分析的机器人。

 

更多优惠、评测和购买指南

 
© .