耶鲁大学的新研究工具将带你深入知识的兔子洞

LUX 是一个数字平台,汇集了大学博物馆、图书馆和档案馆的信息。
Yale Center for British Art in New Haven, CT.
位于康涅狄格州纽黑文的耶鲁大学英国艺术中心。Elizabeth Felicella 摄

LUX,耶鲁大学推出的一款免费新工具,非常适合那些希望深入探索某个感兴趣主题相关无限连接的研究项目。它是一个中心枢纽,整合了耶鲁大学博物馆、档案馆和图书馆的 1700 万个可搜索对象。

该工具的工作方式有些类似于搜索引擎。然而,搜索引擎倾向于返回搜索结果,然后提供链接让你跳转到新网站。LUX 建立搜索对象与馆藏中其他相关对象之间的联系。它超越了对象本身,能够找到晦涩的关联。例如,如果你搜索一件艺术品,它会显示同一位作者的其他作品,以及同一时期或同一地点的其他艺术作品。又或者,如果你搜索陨石,它会展示大学博物馆中实际陨石的图片,以及关于陨石的艺术品和书籍。以前,你必须去不同的地方——自然历史博物馆找陨石,去图书馆找书籍——或者在谷歌上分别搜索并拼凑这些不同的资源。

LUX 的核心是一个名为知识图谱的后端数据模型。它们通常由来自不同来源的数据集组成,并将这些信息组织成一个关系网络。你可以把它想象成侦探用来可视化人物、物体、地点和事件之间联系的证据图板。这个概念可能在 2012 年被谷歌推广。Van Gogh World Wide 也基于一个类似的数据模型运行。随着越来越多的艺术作品被数字化,这种技术在艺术界也越来越受欢迎。

[相关:研究人员为何调查了 73 个博物馆的 11 亿多件藏品]

“没人喜欢搜索,大家都喜欢找到,”耶鲁大学数字文化遗产高级总监 Robert Sanderson 周四在一次媒体吹风会上说。LUX 能够为搜索的对象提供丰富的背景信息。

当你输入一个词到搜索栏时,页面上的标签会将搜索分为不同的类别:对象、作品、人物和群体、地点、概念和事件。高级搜索功能以及侧边的过滤器可以帮助你缩小搜索范围。当你点击进入一个页面时,可能会有超链接引导你发现交叉关联。例如,如果你点击一个艺术品链接,然后又点击其画家链接,你将找到更多关于这位画家影响的概念、其创作时间线、相关人物和群体,以及由这位艺术家创作或关于这位艺术家的其他作品的信息。

构建这个工具的项目已经进行了五年。耶鲁大学希望通过承担繁重的工作,让其他机构更容易构建他们自己的 LUX 版本。因此,LUX 的代码将是开源的。这意味着任何人都可以查看数据库的配置,以及耶鲁大学对数据进行的所有转换。进行搜索的数据库是专有的,但可以授权。将有一个更小、类似的数据库,可以更广泛地提供给资源较少的小型机构。

[相关:谷歌的这项新 AI 工具可能会改变我们的在线搜索方式]

重要的是,LUX 不使用人工智能。该团队没有使用大型语言模型,而是依赖人类智能,这意味着他们雇佣学生来构建元数据的深度,并在六年的时间内为馆藏中的数据集添加标识符。

Sanderson 表示,该团队确实对 ChatGPT 进行了一些实验,并要求它在馆藏中查找特定对象。AI 会给出访问号和查询的 URL 链接,但链接通常不起作用,而访问号则指向一个完全不同的对象。“模型理解语言是如何工作的,但它不是一个知识模型,也不是一个事实模型,”他说。“你会得到看似可信但错误的答案。”

今天向公众开放的 LUX 仍处于开发阶段。该团队已经有了如何改进它的想法,以及他们正在考虑添加的新功能。你会注意到,在结果页面上,如果存在伦理问题或数据有误,会有一个大大的蓝色按钮供用户反馈。

 

更多优惠、评测和购买指南

 
Charlotte Hu Avatar

Charlotte Hu

助理科技编辑

Charlotte 是《趣味科学》的助理科技编辑。她对了解我们与技术的关系如何变化以及我们如何在网上生活感兴趣。


© .