什么是谷歌的语义搜索？

谷歌的既定目标之一是索引世界上所有的信息，包括互联网上不断变化的、混合了知识和俏皮评论的庞杂信息。今天，这个索引得到了上下文的补充，数十亿的属性和连接将数百万个独立的名词——在谷歌的用语中，称为“事物”（Things）——联系起来。这种受上下文信息驱动的数据集通常被称为语义网，但谷歌避免使用这个词，而是称之为知识图谱。

谷歌搜索产品管理总监 Jack Menzel 解释说，人类的对话建立在上下文的基础上。但对计算机而言，上下文是不存在的。问一个人关于“国王”的问题，对方很可能会反问一个问题，以便将你的查询置于上下文中。你是在说洛杉矶国王队吗？还是扑克牌？或者一部电视剧？Menzel 说，谷歌新的搜索算法旨在像人们在对话中一样，消除搜索结果的歧义。

“理解是人类的一部分。对计算机来说，这就像我们突然选择了一种我们都无法说的语言。它只是一堆声音，”他说。“到目前为止，搜索引擎一直缺乏的是，那些词语代表一个具体事物的概念。如果我们维护一个事物的表示，我们就可以用它来更好地理解你想要什么，以及网络本身在谈论什么。”

如果你登录了谷歌，你可能已经看到了这个新功能——它于 5 月 16 日开始推出，并将于 18 日完成对所有已登录的英语用户开放。输入一个搜索词，搜索结果不会仅仅列出你可能感兴趣的内容，而是会提供一组选项。Menzel 以“仙女座”为例。你可以选择星系、希腊神话、瑞典金属乐队等等。

为了实现这一点，谷歌开始索引通用定义，使用了从维基百科到美国中央情报局世界概况（CIA World Factbook）再到谷歌自身产品的所有公共数据库。结果是新增了 5 亿个（个、地方和事物），它们之间有 35 亿个连接。除了让你缩小上下文范围，搜索结果现在还包含一些小的连接和建议，以丰富初始搜索词。

例如，人物搜索结果会附带传记信息；地点搜索结果会附带关于该地的数据，等等。搜索弗兰克·劳埃德·赖特（Frank Lloyd Wright），你会看到一个基于维基百科的关于他的摘要，一段传记草图，以及谷歌精心策划的由他设计的房屋列表，点击后可以获取更多信息。

事物的定义本质上是上下文相关的——你对“国王”的第一个定义是曲棍球队、篮球队、电视剧还是帮派，取决于你是谁、你在哪里。Menzel 说，谷歌还会根据你的搜索记录，尤其是你的位置来做一些判断。他举了一个谷歌加州山景城办公室附近地点的例子——当他搜索“大熊”（Great Bear）时，谷歌会显示一个北加州的休闲区和一个圣克鲁兹的咖啡店。在你所在的位置，它可能会显示其他内容。但他表示，个性化功能仍不完善。

最终目标是实现更智能的搜索，能够像人一样思考，并考虑你的个性和上下文。Menzel 说，这不仅仅是知道某个事物是一个事物，“而是关于这个事物什么是最重要的，什么与这个事物相关，以及关于这个事物有什么联系。我们如何利用对世界的这种理解，来改善你的信息获取？”