计算机算法可以识别讽刺（这真是太酷了）

作者：Clay Dillow

发布于 2010年5月18日下午5:38 EDT

追求机器智能意味着我们必须找到与计算机沟通的方式，使其双方都能理解。但计算机能以直接的方式处理口头指令，而人类则倾向于使用更复杂的语言形式，运用俚语或符号来传达想法。因此，一个以色列的研究团队开发了一种机器算法，可以识别讽刺。

SASI（一种半监督讽刺识别算法）可以以惊人的77%的准确率识别在线产品评论中的讽刺句子。为了创建这种算法，该团队扫描了66,000条亚马逊产品评论，并由三名不同的人工标注员对句子进行讽刺标记。然后，该团队识别出评论中出现的某些讽刺模式，并创建了一个分类算法，将每个陈述归入讽刺类别。

然后，算法在80个来自评论集的种子句子上进行了训练。这些标注过的句子帮助算法学会了哪些词语和模式能够区分讽刺性评论——那些意图与字面意思相反，或者传达的情感与字面理解不一致的评论。

然后，他们将算法应用于评估集。模式评估的效率在81%的情况下得分准确，而模式识别/讽刺分类算法的整体准确率在77%的情况下是准确的。对于计算机第一次尝试解读人类幽默感来说，这已经很不错了。

这一切并不是为了让你的Roomba在你告诉它“你真差劲”的时候能理解笑话。能够识别讽刺性陈述的计算机程序可以通过不将标题为“保留好收据”的产品评论误认为是明智的在线购物建议，从而生成更好的个性化内容并向人类用户做出更好的推荐。它还可以使那些在网上搜索以衡量公众对产品或想法的看法的意见挖掘系统受益。

[希伯来大学通过 Slashdot]

© .