

谷歌的既定目标之一是索引世界上所有的信息,包括互联网上不断变化的、混合了知识和俏皮评论的庞杂信息。今天,这个索引得到了上下文的补充,数十亿的属性和连接将数百万个独立的名词——在谷歌的用语中,称为“事物”(Things)——联系起来。这种受上下文信息驱动的数据集通常被称为语义网,但谷歌避免使用这个词,而是称之为知识图谱。
谷歌搜索产品管理总监 Jack Menzel 解释说,人类的对话建立在上下文的基础上。但对计算机而言,上下文是不存在的。问一个人关于“国王”的问题,对方很可能会反问一个问题,以便将你的查询置于上下文中。你是在说洛杉矶国王队吗?还是扑克牌?或者一部电视剧?Menzel 说,谷歌新的搜索算法旨在像人们在对话中一样,消除搜索结果的歧义。
“理解是人类的一部分。对计算机来说,这就像我们突然选择了一种我们都无法说的语言。它只是一堆声音,”他说。“到目前为止,搜索引擎一直缺乏的是,那些词语代表一个具体事物的概念。如果我们维护一个事物的表示,我们就可以用它来更好地理解你想要什么,以及网络本身在谈论什么。”
如果你登录了谷歌,你可能已经看到了这个新功能——它于 5 月 16 日开始推出,并将于 18 日完成对所有已登录的英语用户开放。输入一个搜索词,搜索结果不会仅仅列出你可能感兴趣的内容,而是会提供一组选项。Menzel 以“仙女座”为例。你可以选择星系、希腊神话、瑞典金属乐队等等。
为了实现这一点,谷歌开始索引通用定义,使用了从维基百科到美国中央情报局世界概况(CIA World Factbook)再到谷歌自身产品的所有公共数据库。结果是新增了 5 亿个(个、地方和事物),它们之间有 35 亿个连接。除了让你缩小上下文范围,搜索结果现在还包含一些小的连接和建议,以丰富初始搜索词。
例如,人物搜索结果会附带传记信息;地点搜索结果会附带关于该地的数据,等等。搜索弗兰克·劳埃德·赖特(Frank Lloyd Wright),你会看到一个基于维基百科的关于他的摘要,一段传记草图,以及谷歌精心策划的由他设计的房屋列表,点击后可以获取更多信息。
事物的定义本质上是上下文相关的——你对“国王”的第一个定义是曲棍球队、篮球队、电视剧还是帮派,取决于你是谁、你在哪里。Menzel 说,谷歌还会根据你的搜索记录,尤其是你的位置来做一些判断。他举了一个谷歌加州山景城办公室附近地点的例子——当他搜索“大熊”(Great Bear)时,谷歌会显示一个北加州的休闲区和一个圣克鲁兹的咖啡店。在你所在的位置,它可能会显示其他内容。但他表示,个性化功能仍不完善。
最终目标是实现更智能的搜索,能够像人一样思考,并考虑你的个性和上下文。Menzel 说,这不仅仅是知道某个事物是一个事物,“而是关于这个事物什么是最重要的,什么与这个事物相关,以及关于这个事物有什么联系。我们如何利用对世界的这种理解,来改善你的信息获取?”