

谷歌搜索每年处理数万亿次查询,但对于公司外部的人来说,搜索引擎的确切运作方式仍然是个谜。有些人,比如美国总统唐纳德·特朗普,认为这种不透明存在政治偏见。但虽然驱动谷歌搜索的确切算法是未知的,但其大致的运作方式——以及一些历史——是可以了解的。而且,它具有一定的神秘性,对普通互联网用户来说实际上是件好事。
谷歌的搜索系统由专有算法驱动,该算法会根据其认为用户想要的结果来提供搜索结果。广义上说,这些隐藏在谷歌搜索引擎背后的齿轮会考虑常识性因素,比如关键词——出现在文章标题、URL 和正文中的词语——以及网站之间如何相互链接。更复杂的是,用户的具体搜索结果会有所不同,因为该公司会尝试根据其网络历史记录或位置来定制搜索结果。“咖啡”这个词在曼哈顿的搜索结果应该与在芝加哥的搜索结果不同。这背后的算法同样是难以捉摸的。
因此,虽然我们不确切知道谷歌的算法是如何工作的——该公司表示每年会对其进行数百次调整——但营销人员和其他专业人士会使用一些策略来尝试提高其内容在搜索结果中的排名。搜索引擎优化(SEO)在结果出现的顺序中扮演着重要角色,这意味着拥有更多资源投入到这项实践中的大公司可以表现得更好。强大的组织可能会有专门负责这项实践的整个部门,而小型机构则依赖效果较差的策略。充其量,SEO 是一种良好的商业实践,最坏的情况下,它是一个精明的创作者试图作弊的机会,这让谷歌陷入了关于它应该在第一位共享多少信息的困境——也揭示了为什么拥有一个优先显示那些理应排在首位的搜索结果的搜索引擎如此重要。
哥伦比亚商学院市场营销学教授 Miklos Sarvary 在谈到 SEO 和驱动谷歌搜索的算法时说:“这是一个除算法本身之外,其他方面都相当被理解的生态系统。”
Sarvary 说,谷歌的目标“并不是要产生某种政治结果”,尤其是在像任何大公司一样,它可以在华盛顿特区为其利益进行游说。“他们有更重要的事情要做,而不是去搞什么左右政治偏见。”
“他们的目标确实是满足搜索者的需求,”他补充道。
这一分析与谷歌对特朗普推文的官方回应一致;该公司的声明写道:“当用户在谷歌搜索栏中输入查询时,我们的目标是确保他们在几秒钟内获得最相关的答案。搜索不被用于制定政治议程,我们也不会偏袒任何政治意识形态的结果。每年,我们都会对算法进行数百项改进,以确保它们能对用户的查询提供高质量的内容。我们不断努力改进谷歌搜索,我们绝不会操纵政治情绪来排名搜索结果。”
值得指出的是,“偏见”一词与“正面”或“负面”不同。在搜索结果的情况下,“偏见”是指为了推广某种议程而进行的人为排名;搜索结果可能既没有偏见,又大量地偏向负面或正面。
问题在于,对于一个将词语输入谷歌引擎的用户来说,幕后的运作是神秘的。但如果不是这样,人们就会操纵系统来让他们的网站排名更高。
虽然今天它已经成为一个充满争议的政治话题,但谷歌搜索引擎技术的根源可以追溯到一个截然不同的时代,当时谷歌还处于起步阶段。
“谷歌当时的一大创新——这塑造了它此后处理搜索的方式——是不仅查看页面上列出的关键词,”网络安全公司 Shape Security 的首席技术官、前谷歌“点击欺诈”沙皇 Shuman Ghosemajumder 说,“而且还要查看该特定页面和网站与互联网其他生态系统的关系。”例如,这是确保一个网站通过反复在白色背景上使用白色文字来重复某个关键词,却因此赢得该词搜索结果的改进。
有趣的是,这项工作的种子可以追溯到谷歌联合创始人拉里·佩奇在 20 世纪 90 年代在斯坦福大学进行的研究。当时他并没有想到搜索引擎。“令人惊讶的是,我当时没有想到要构建一个搜索引擎,”佩奇在谈到那个时期时说,根据 Adam Fisher 的硅谷口述历史《天才之谷》(Valley of Genius)。“这个想法甚至不在考虑范围内。”
但当然,公司确实创建了一个搜索引擎,如今,谷歌大致如此描述其工作方式:从“分析你的词语”到“对有用页面进行排名”再到“返回最佳结果”。
Ghosemajumder 说:“他们不会透露搜索算法的所有内容,也不会透露所有驱动谷歌搜索的系统。“完全透明的缺点是会被操纵——会有很多人试图利用谷歌透露的任何信息,以便让他们的搜索结果排名比实际合理或对大多数用户真正相关的排名更高。”