
本文最初发表于The Conversation。
语言是人们所说世界的窗口——反映了他们重视和日常经历的东西。
因此,不同语言侧重于不同词汇领域也许并不奇怪。学者们指出,蒙古语有很多与马相关的词,毛利语有很多表示蕨类植物的词,日语有很多与味道相关的词。
有些联系并不令人意外,例如德语有很多与啤酒相关的词,斐济语有很多表示鱼的词。语言学家 Paul Zinsli 撰写了一整本书,专门介绍瑞士德语中与山相关的词。
在我们最近发表的研究中,我们采取了一种广泛的方法来理解不同语言和概念之间的联系。
我们使用计算方法,确定了特定语言的典型词汇领域,以洞察语言和文化的多样性。
我们的工作有助于加深对语言、文化及其相互关系的理解。

我们的方法
我们根据文献,测试了 163 个语言与概念之间的联系。
我们整理了一个包含 1574 部双语词典的数字数据集,这些词典翻译了英语与 616 种不同语言。由于其中许多词典仍在版权保护期内,我们只能访问特定单词在每本词典中出现的频率计数。
我们考察的一个概念的例子是“马”,得分最高的语言包括法语、德语、哈萨克语和蒙古语。这意味着这些语言的词典中有相对较多的
然而,出现计数也可能受到“马”出现在与不相关术语相关的例句中的影响。
并非谣言?
我们的发现支持了研究人员之前强调的大部分联系,包括印地语有很多与爱相关的词,日语有很多与义务和责任相关的词。

我们尤其感兴趣的是检验因纽特语有很多表示雪的词的说法。这一臭名昭著的说法长期以来被歪曲和夸大。它甚至被称为“伟大的因纽特语词汇骗局”,一些专家认为这根本不属实。
但我们的结果表明,因纽特语的雪词汇确实非同寻常。在 616 种语言中,在“雪”这个概念上得分最高的语言是东加拿大因纽特语。我们数据集中另外两种因纽特语(西加拿大因纽特语和阿拉斯加北部伊努皮亚特语)在“雪”这个概念上得分也很高。
我们数据集中的东加拿大因纽特语词典包含诸如kikalukpok(意为“在硬雪上发出的嘈杂的行走声”)和apingaut(意为“初雪”)等词。
在“雪”这个概念上排名前 20 的语言包括阿拉斯加的几种其他语言,如阿特纳语、德纳依纳语和中部阿拉斯加尤皮克语,以及日语和苏格兰语。
苏格兰语包含诸如doon-lay(意为“大雪”)、feughter(意为“突然的、微小的降雪”)和fuddum(意为“间歇性积雪”)等词。
您可以使用我们开发的工具来探索我们的发现,该工具可让您识别任何给定概念的最高得分语言,以及特定语言的最高得分概念。
语言与环境
尽管“雪”得分最高的语言都说在降雪地区,但“雨”得分最高的语言并不总是来自最湿润的地区。
例如,南非的降雨量中等,但该地区的语言,如尼亚尼亚语、东塔语和绍纳语,有很多与雨相关的词。这可能是因为,与雪不同,雨对人类生存至关重要——这意味着人们即使在没有雨的时候也会谈论它。
对于东塔语的使用者来说,雨既相对稀少又令人渴望。这体现在诸如lábe ||núu-bâ(“向雷鸣致敬以带来雨水的尊称”)和|qába(指“仪式性地洒水或撒尿以带来雨水”)等词语中。
我们的工具还可以用来探索与感知(“气味”)、情感(“爱”)和文化信仰(“鬼魂”)相关的各种概念。
在“气味”方面得分最高的语言包括一批大洋洲语言,如马绍尔语,其中包含诸如jatbo(意为“湿衣服的气味”)、meļļā(意为“血腥味”)和aelel(意为“鱼的味道,残留在手上、身上或器具上”)等词。
在我们研究之前,太平洋岛屿的气味词汇几乎没有受到关注。
一些注意事项
尽管我们的分析揭示了语言和概念之间许多有趣的联系,但结果并非总是可靠的——并且应尽可能与原始词典进行核对。
例如,普劳特语(门诺派低地德语)的最高概念包括von(“的”)、den(“那个”)和und(“和”)——这些都毫无启发性。我们使用Wiktionary排除了其他语言中类似的词,但我们的方法没有过滤掉普劳特语中这些常用词。
此外,词语计数既反映了词典定义,也反映了其他元素,如例句。虽然我们的分析排除了特别可能出现在例句中的词(如“女人”和“父亲”),但这些词在一定程度上仍然可能影响了我们的结果。
最重要的是,如果按字面意思理解,我们的结果存在加剧可能有害刻板印象的风险。因此,我们敦促在使用该工具时保持谨慎和尊重。它为任何给定语言列出的概念,最多只能粗略地反映与该语言相关的文化。