

一名在剑桥大学深造的博士生解开了一个自公元前五世纪以来一直困扰学者的难题。Rishi Rajpopat 破译了波你尼(Pāṇini)教授的一条规则。波你尼是一位印度语法学家,据信生活在今天的巴基斯坦西北部和阿富汗东南部。学者们称他为语言学之父之一。
梵文是一种古老的印欧语系语言,源自南亚,是印度教的圣语和文学语言。印度许多伟大的科学、哲学、诗歌和其他世俗文学作品也用梵文写成。如今,该国约有25,000人说梵文。
[相关:这些“假的”古罗马硬币可能实际上是真的。]
“印度一些最古老的智慧是用梵文创作的,而我们仍然不完全理解我们的祖先取得了什么成就,”Rajpopat 在一份声明中说。他曾是一名高中生时首次学习梵文,现在就读于圣安德鲁斯大学。“我们常常被告知我们不重要,我们没有做出足够的贡献。我希望这项发现能给印度的学生带来信心、自豪感和希望,让他们知道自己也能成就伟大的事业。”
随着 Rajpopat 的这项发现,学者们现在可以构建数百万个语法正确的梵文单词。这些研究成果已作为 Rajpopat 的博士论文于2021年发表。
Rajpopat 破译了一个拥有2500年历史的算法,该算法首次能够准确地使用波你尼的“语言机器”。波你尼的系统包含4000条规则,详细记录在他的《语法书》(Aṣṭādhyāyī)中。《语法书》被认为是他的杰作,据信写于公元前500年左右。它的设计原理就像一台机器,输入词语的词根和后缀,然后通过一个分步过程生成语法正确的单词和句子。
“波你尼拥有非凡的头脑,他建造了一台人类历史上无与伦比的机器,”Rajpopat 说。“他并不期望我们往他的规则中添加新的想法。我们越是摆弄波你尼的语法,它就越难以捉摸。”
通常,波你尼的两条或多条规则可以同时应用于过程中的某个步骤,这让学者们在选择哪条规则或哪个步骤时感到痛苦。
需要一个算法来解决这种规则冲突,它影响着数百万梵文单词,包括常用词“mantra”(咒语)和“guru”(上师)的某些形式。波你尼有一个元规则来帮助用户决定在发生规则冲突时应应用哪条规则,但过去2500年来,学者们一直误解了这条规则。
[相关:研究人员发现他们认为是一张有2000年历史的星图。]
传统上,波你尼的元规则被解释为:在两条同等强度的规则发生冲突时,在语法序列中靠后的规则获胜。然而,Rajpopat 认为,波你尼的意思是,在分别适用于单词左侧和右侧的规则之间,波你尼希望我们选择适用于右侧的规则。
“我在剑桥有一个顿悟的时刻。在花了九个月试图解决这个问题后,我几乎要放弃了,因为我一无所获。所以我关了书本一个月,尽情享受夏天,游泳、骑自行车、做饭、祈祷和冥想,”Rajpopat 说。“然后,我不太情愿地回去工作,几分钟之内,当我翻阅书页时,这些模式开始显现,一切都说得通了。还有很多工作要做,但我已经找到了这个谜题中最重要的一部分。”
通过采用波你尼期望选择适用于右侧的规则这一解释,Rajpopat 发现这位古代学者的语言机器几乎毫无例外地、一致地生成了语法正确的单词。
在接下来的两年半里,他致力于解决他所发现和提出的问题。除了更深入地理解梵文文本外,运行波你尼语法的算法还有可能被教授给计算机。
“从事自然语言处理的计算机科学家在50多年前就放弃了基于规则的方法,”Rajpopat 说。“因此,教会计算机如何将说话者的意图与波你尼的基于规则的语法相结合来产生人类语音,将是人类与机器互动历史以及印度知识史上的一大里程碑。”