多邻国是如何将海地克里奥尔语添加到其语言库的

深入了解该应用程序如何设计新的语言体验。
duolingo haitian course promo ad miami
多邻国正通过与全国各地的海地餐馆合作来推广其新的语言课程。多邻国

广受欢迎的语言学习应用程序多邻国(Duolingo)将于 2 月 22 日新增海地克里奥尔语课程。为配合此次发布,该科技平台还将与美国各地的海地人经营的餐馆合作,推广该课程。

“海地克里奥尔语在美国已经普及。它是一种非常重要的语言。在迈阿密,它是继英语和西班牙语之后的第三大常用语言,”多邻国的高级学习科学家 Cindy Blanco 说。“我们鼓励学习者在这些餐馆使用海地克里奥尔语。我们这样做的部分动机是为了确保我们将语言与文化和社区联系起来。”

多邻国由卡内基梅隆大学的计算机科学家创建,它将语言学习与技术相结合,例如融入机器学习等技术。这家总部位于匹兹堡的科技独角兽(指估值超过 10 亿美元的初创公司)于 2012 年首次推出,并于 2021 年 上市。多邻国以其 略显疯狂的吉祥物 在流行文化中广为人知,与许多其他语言学习应用程序一样,多邻国在 疫情期间 应用程序下载量激增。

为了开发课程内容,多邻国与佛罗里达国际大学的语言学家 Nicolas André 合作。

“我们的海地克里奥尔语团队决定了我们在课程中需要教授的词汇和您需要的语法,”Blanco 说。“然后他们会想出短语、单词和句子来完成教学。”

这带来了独特的挑战,因为海地克里奥尔语在历史上是一种口头语言,书写、拼写和语法规则很少明确规定。

“我们需要弄清楚向学习者呈现什么,因为实际上海地克里奥尔语使用者本身可能并不都对公认的拼写、如何说这个句子或这个想法的最佳方式有相同的看法,”Blanco 说。“对于西班牙语和法语等许多语言,都有正式的组织负责此事。现在海地克里奥尔语也有一个这样的组织,所以我们的团队在很大程度上依赖于这些正在发展的语言标准。”

海地克里奥尔语是多邻国今年计划添加的几种新语言中的第一种。目前,他们拥有 41 种语言的 104 门课程。

“对我们来说,这永远不够。全球有 7000 多种语言,我们只有 41 种。还有很多,”Blanco 说。“我们希望我们能教所有语言。”

多邻国如何创造语言体验

为了在应用程序中构建语言体验,具有语言教学背景的 Blanco 负责弄清楚如何将团队在语言学习和语言教学方面的知识与他们对人们如何与应用程序和移动技术互动和导航的知识相结合。

虽然语言学习应用程序 无法提供与沉浸在外语国家相同的体验,但多邻国试图让其界面变得有趣且互动,因此用户很可能会继续使用它,并能够接续之前的进度。在主选项卡上,有一系列技能测验供用户进行,还有用于听力课程、用于阅读和听力理解的故事以及一个计分板,用于与其他用户的进度进行比较。

“我们拥有的技术非常灵活。只要我们提供正确的信息,它就可以从我们的课程、句子和词汇等内容中提取信息来创建一门课程,”Blanco 说。他们拥有的机器学习算法还可以跟踪用户正在处理的内容和练习,以调整他们接下来看到的内容。例如,如果用户在一个概念上表现特别好,算法可能会更早地触发更难的练习。

总的来说,不同语言课程的设计具有共同的结构。“如果你是一个初学者,在我们完成这个单元后,你希望能够用这种语言做什么?这可能包括自我介绍、谈论家人、问路、在餐厅点餐等,”Blanco 说。“我们从这些沟通目标开始,而且这些目标通常在不同语言中是相同的。”

对于这些目标中的每一个,团队都会考虑实现该目标所需的词汇和语法。而这正是可能出现分歧的地方。“也许在西班牙语课程中你会比在法语课程中更早遇到某些结构,这取决于语法的难度或你想如何安排这些沟通目标,”Blanco 解释说。“具体的词汇和语法可能差异很大。这 realmente 是一个需要仔细研究的顺序问题,以实现所有这些沟通目标。”

语言学习如何融入其中

该应用程序的学习方式与儿童学习新语言的方式既相似又 不同。相似之处在于接触和输入的概念。“你需要大量的实践经验,”Blanco 说。这对于孩子们来说很容易,因为他们在家里和学校听到成年人、家人和朋友如何使用这种语言。

“这对成年人来说真的很困难。这也促使了应用程序的开发,”她指出。“我们知道接触和输入非常重要。所以我们努力让它变得非常有趣和容易重新接触语言,这样你就可以在通勤时学习 5 分钟,可以在睡前学习,而无需安排一个小时的课堂时间。”

除了接触之外,多邻国还将让用户从“接受性”练习开始,用户在其中接收新语言,但尚不需要做出回应。随着他们继续学习课程,他们将获得更多“生产性”练习,在这些练习中他们必须写出翻译和回应,或者说出单词。

该技术不仅能给用户评分,还能评估不同练习的难度,并据此确定整个学习过程中的课程顺序。

“有一些关于难度的普遍规律,适用于所有情况。接受性练习,翻译成英语,对每个人来说都会更容易,”Blanco 说。“但根据你个人犯错和错误的模式,它会找出哪些练习对你来说很棘手,你对哪些词汇和语法更难掌握,然后我们可以根据你独特的学习模式进行个性化。”

他们从孩子学习中借鉴的另一个特点是他们称之为隐含教学。这意味着并非句子中的每个单词都需要被翻译和记忆,并且随着用户参与内容和课程,他们将开始注意到句子中的词序,并在每种情况下推断出语法是如何工作的。

[相关: 麻省理工学院的科学家教会机器人如何互相破坏]

“我们无法让成人体验像儿童那样高效。孩子们没有工作,他们有大量的时间,他们身边有很多很多人,”Blanco 说。“对于成人,我们永远无法创造那样的体验。但我们可以做一些事情来加快进程。”

这是通过将隐含学习与更明确的指导、纠正或反馈相结合来实现的。“在我们更大的课程中,比如法语课程,你会得到更多关于不同类型错误的提示和信息,”Blanco 说。“我们知道隐含学习能让你学到更多类型的信息,但我们也知道我们需要补充。”算法有助于设定这些明确评论出现的频率,以及针对哪些错误。例如,它可以区分简单的拼写错误和更严重的语法问题。

多邻国正在做什么

Blanco 认为,许多新的技术发展使得语音识别等挑战变得更容易。但他们使用的模型与典型的语言模型不同。“部分原因是我们的用例与客户服务聊天应用程序中使用的技术截然不同,”她说,因为多邻国的用户本质上不是他们选择学习的语言的母语者。“客户服务聊天机器人会寻找特定的关键词,但它们也期望某些类型的措辞和语法。”他们的算法会期望某些类型的错误。

这是一个正在进行中的项目。该团队正在尝试让技术摆脱仅仅是翻译,尽管从计算上来说,翻译更容易实现。

“我认为我们在有效语言教学方面的下一个前沿是我们将如何处理开放式语音和开放式问题,”她说。

 

更多优惠、评测和购买指南

 
Charlotte Hu Avatar

Charlotte Hu

助理科技编辑

Charlotte 是《趣味科学》的助理科技编辑。她对了解我们与技术的关系如何变化以及我们如何在网上生活感兴趣。


© .