IBM 认为它可以让你成为更好的作家

但这是错误的
httpswww.popsci.comsitespopsci.comfileswriting-compared.jpg
对马克·吐温 1876 年的信件进行的分析,与我上周的电子邮件进行了比较。截图
httpswww.popsci.comsitespopsci.comfilesscreen_shot_2015-07-20_at_3.09.23_pm.png
使用 IBM 语气分析仪进行的样本分析。IBM Watson Developer Cloud

今天早上醒来时,我从未想过能将我的书信写作技巧与一位有史以来最伟大的作家相提并论。然而,正如技术发展的规律一样,我错了。IBM 的网络创新中心 Watson Developer Cloud 发布了他们新工具的演示:语气分析仪,旨在检测“书面沟通中的情感语气、社交倾向和写作风格”。IBM 希望让我们成为更好的作家——我对此很赞同。于是我试用了一下。

作为一名典型的(可以说:神经质的)作家,我首先想到的是,将我随意的写作与一位文学巨匠——比如马克·吐温——进行比较。于是我找到了一封吐温在 1876 年写的信,然后将其输入到机器中。我同样处理了我上周发送给 PopSci 一位编辑的电子邮件的另一部分。

结果令人惊讶地接近(而且我知道我的写作技巧客观上远不及吐温)。语气分析仪将写作分为三种语气:情感语气、社交语气和写作语气。在这些类别中,吐温的情感语气得分为 4%,社交语气得分为 88%,写作语气得分为 7%。我的情感语气为 2%,社交语气为 90%,写作语气为 6%。(未计入的百分比似乎是专有名词和其他计算机无法理解的词语。)它还捕捉到我们写作中的其他细微差别,比如它认为是“快乐”的词。吐温有 4 个“快乐”词(dear, pleasure, thanks, pleasant),而我只有 1 个(hope)。

那么这说明了什么?吐温的语气比我高 1 个百分点?他比我开心四倍?不,我们结果的相似性实际上暴露了这款软件的根本问题:它缺乏从词到词的上下文。在测试该程序时,“我很生气”这句话和“我不生气”这句话会得到完全相同的“愤怒”读数,因为计算机一次只能读取一个词。这使得该软件非常擅长查找可能引起不良反应的单个词语,但却对这些词语的更深层含义视而不见。如果自动化或盲目使用,这可能会导致问题。

例如,如果你在电脑上使用过基本的文字处理器(我是在 Word 97 上入门的),你可能会记得右键单击一个词并将其替换为听起来更重要的同义词的最初乐趣。单词“better”变成了“surpassing”,很快你的句子就和你最初写的完全不一样了。这和这里的想法一样,事实上,语气分析仪提供了同样的替换单词的选项。我的句子“抱歉,大脑处于休假模式”变成了“严峻,智力成功休假模式”。

语气分析仪并不是唯一一个,也绝非第一个写作成效不佳的工具,而且值得注意的是它仍处于开发阶段。考虑到它声称能够有效识别和纠正好的写作,它的效果尤其不佳。我认为我们也没有用不公平的标准来衡量它。如果一个程序想识别社交线索和写作风格,那么需要比一次一个词的样本更大量的样本。

这个问题普遍存在于大多数写作软件中,这也是为什么我们的电子邮件应用程序不会弹出小提示说“你生气了吗?你可能不想发送这封电子邮件”。这是因为我们的软件并非 100% 的时间都能理解人类生成的写作,尽管有些软件已经做得非常接近了。

Automated Insights 与美联社合作生成体育故事,它颠倒了软件理解语言的用法。通过一组输入,例如体育比分,计算机可以使用一个形容词和动词库来描述数据。这与分析书面材料的思路相反,但道理是相通的;软件有关于可读性和规范写作的指导方针。

网络上其他目标更有限的工具包括Hemingway 编辑器,它专注于简洁和减少被动语态的使用,以及文本内容分析工具

但 IBM 的这款工具并非糟糕透顶;它逐字阅读你的文本,并识别这些词的常见含义。如果集成到本地电子邮件应用程序或专业消息服务中,这无疑会非常有帮助。然而,在一个正在努力抓住人工智能边缘的现代世界中,这款软件只是反映了大多数程序距离实现那个黄金标准还有多远。

 

更多优惠、评测和购买指南

 
© .