这个 AI 可以帮助识别有偏见的网站和虚假新闻

我们应该从中吸取教训。

任何从事媒体工作的的事实核查员都有一项直接但具有挑战性的工作:确保文章中的所有说法都是真实的。像两个城市之间的距离这样简单的事实是否准确?引语是否正确?更广泛的陈述是否属实?这是一项重要的任务,在一个充斥着彻头彻尾的假新闻的时代——尤其是考虑到 2016 年的选举和即将到来的中期选举——它正变得越来越重要。

为了应对这个更大的问题,来自麻省理工学院以及卡塔尔和保加利亚的机构的研究人员一直在努力利用人工智能来帮助人们理解复杂的媒体格局。他们意识到,在开发一个能够核查单个说法的人工智能之前,他们需要采取的一个重要步骤是首先分析不同新闻网站本身的可靠性。

因此,他们着手制作一个人工智能,能够评估不同网站在事实上的强度以及它们的政治倾向。

为了训练他们的人工智能系统,他们首先使用了来自 Media Bias / Fact Check 网站上的 1,066 个网站的数据。然后,人工智能分析了有关新闻网站的信息,考虑了来自网站自身文章、维基百科页面、Twitter 账户甚至 URL 的来源。利用这些信息,人工智能在预测网站的事实准确性方面达到了约 65% 的准确率,在检测其倾向性方面达到了约 70% 的准确率。

人工智能的一个最佳资源是人类也依赖的资源。“事实证明,维基百科非常重要,”麻省理工学院计算机科学与人工智能实验室的博士后研究员、这篇论文的第一作者 Ramy Baly 说道。这是因为关于新闻来源你需要了解的信息可能就在那里:例如,《洋葱新闻》的维基百科页面在顶部就将其标记为讽刺性新闻。Drudge Report 的维基百科页面则将其标记为保守派。

维基百科之所以重要还有另一个原因。“没有维基百科页面与网站不太可靠有关,”Baly 补充道。

MIT CSAIL
麻省理工学院的研究结果显示,具有“极端”偏见的出版物与较低的事实准确性之间存在相关性。麻省理工学院 CSAIL

考虑到网站本身的整体可信度——以及查看其维基百科页面(如果存在)——对于普通人来说也是一个好方法。例如,今年 8 月,Facebook 和一家网络安全公司宣布,他们发现了来自伊朗的“不真实”新闻。与伊朗相关的网站之一是 Liberty Front Press;他们自称“独立”,但实际上似乎亲伊朗。值得注意的是,该网站似乎没有维基百科页面。(Facebook 也有一些很好的技巧供我们非人工智能用户在寻找假新闻时参考。)

当然,麻省理工学院的研究小组并不是唯一使用人工智能来分析此类语言的人:谷歌制造的人工智能系统 Jigsaw 会自动评估读者评论的毒性,而 Facebook 也转向人工智能来帮助其在缅甸遏制仇恨言论的工作。

对麻省理工学院研究人员的人工智能系统来说,还有一个比维基百科更重要的来源:网站本身的啲文章。人工智能能够分析每个新闻网站上的 50 到 150 篇文章,并检查其中的语言。“极端偏激的网站试图迎合读者的情绪,”Baly 说。“与主流、中间派的网站相比,它们使用了不同的语言。”

Baly 表示,他们仍希望让系统更加完善。在这个阶段,他们的目标是“开创一种思考如何解决这个问题的全新方式”。

 

更多优惠、评测和购买指南

 
Rob Verger Avatar

Rob Verger

技术编辑

罗布·沃格尔是《流行科学》杂志的前技术编辑。他擅长报道航空、交通和军事技术。


© .