谷歌开发了一款与海豚交流的人工智能模型

新大型语言模型名为 DolphinGemma。
Spotted dolphin with head above water
该大型语言模型是利用四十年的海豚数据构建的。图片来源:Deposit Photos / Gerard Lacz

一款新推出的大型语言模型 AI系统或将很快使人类能够与 海豚进行对话。该系统定于未来几个月内推出,研究人员将测试 DolphinGemma 及其配套的鲸目听觉增强遥测 (CHAT) 系统是否能够翻译和模仿该哺乳动物自身复杂的声音。如果成功,这项突破可能标志着长达四十多年的研究、记录和保护工作的顶峰。

海豚是地球上最聪明、最善于交流的动物之一。它们的社交互动非常复杂,以至于“野外海豚项目”(WDP) 的研究人员花了过去40年试图破译它们。在此过程中,WDP 积累了数十年的水下音频和视频资料,记录了巴哈马地区一个独立的斑纹海豚种群。他们能够将声音与求偶、独特的姓名以及海豚间的争吵等行为方面联系起来。

专家们长期以来一直认为,人类有可能真正与鲸目动物交流,但缺乏足够先进的技术来解析和模仿该物种的水下哨声、咔嗒声和爆破脉冲。随着大型语言模型 (LLM) 的兴起,研究人员最近开始思考,LLM 所基于的原理是否可以应用于海豚互动。为了检验这种可能性,WDP 最近与谷歌和佐治亚理工学院合作,为工程师提供了一个庞大、标注过的海豚哨声、咔嗒声和爆破脉冲数据集,用于 LLM 训练。

结果是 DolphinGemma,一个利用运行谷歌 Gemini 系统的相同技术构建的人工智能模型。DolphinGemma 基于大约4亿个参数设计,其功能与 ChatGPT 等预测性 LLM 基本相同,但它是为海豚设计的。

DolphinGemma 首先接收并解释音频输入,然后预测后续可能的发声以进行重现。接着,它与安装在改装的谷歌 Pixel 智能手机上的 CHAT 系统配对。CHAT 的设计目的不是完全翻译海豚的自然语言,而是帮助人类传达和建立更简化、共享的词汇。其计划是教导 WDP 的斑纹海豚群一系列合成哨声,代表它们最喜欢的物品,如海草、马尾藻,甚至是研究人员的围巾。随着时间的推移,专家们希望海豚甚至能学会要求想要的物品,以便玩耍。

在人类与海豚跨越物种交流的鸿沟之前,还有很多工作要做。但通过这种富有创意的 LLM 应用,水下对话又向前迈进了一步。

 

更多优惠、评测和购买指南

 
© .