谷歌在 I/O 2023 上预览了 AI 驱动的未来

这是一场语言模型的全面接管。
Google I/O presentation about their updated language model named Gecko.
谷歌的一款语言模型即将获得重大升级。谷歌/YouTube

谷歌一年一度的I/O开发者大会展示了这家科技巨头在改进其庞大的产品和服务系列方面所做的所有创新工作。今年,该公司强调它将在人工智能,特别是生成式人工智能方面大举投入。预计您将在谷歌的Workspace、应用程序和云的众多关键服务中看到更多由AI驱动的功能。

谷歌及Alphabet首席执行官桑达尔·皮查伊在主题演讲中表示:“作为一家AI优先的公司,我们正处于一个激动人心的转折点……我们一直在将AI应用于我们的产品,使它们变得更加有用。通过生成式AI,我们正在迈出下一步。”“我们正在重新构想我们所有的核心产品,包括搜索。”

以下是人工智能创造的未来发展趋势的概览。

用户将很快能够与生成式AI协同工作,编辑他们的照片,为他们的幻灯片创建图像,分析表格中的数据,撰写Gmail电子邮件,制作Meet会议的背景,甚至在Docs中获得写作辅助。它还将AI应用于翻译,通过匹配唇部动作和单词,使说英语的人的讲话能够被翻译成西班牙语,同时调整他们的唇部动作以匹配。为了帮助用户区分生成式AI处理过的内容,该公司表示,作为其负责任AI的努力的一部分,它正在为合成图像创建特殊的数字水印和元数据注释。

谷歌大部分新公告的基础是其对名为PaLM的语言模型的升级。该模型此前曾被用于回答通常会问及人类医生的医疗问题。PaLM 2,该模型的下一个版本,有望比其前代产品更快、更高效。它还提供四种尺寸,从小型到大型,分别称为Gecko、Otter、Bison和Unicorn。最轻量级的Gecko模型非常适合用于移动设备和离线模式。谷歌目前正在最新的手机上测试该模型。

[相关:谷歌的人工智能在写出下一部伟大长篇小说之前还有很长的路要走]

据谷歌称,PaLM 2更具多语言能力,并且在推理方面也更出色。该公司表示,大量的科学论文和数学表达式被纳入其训练数据集中,以帮助它处理逻辑和常识。它还可以处理更细微的文本,如习语、诗歌和谜语。PaLM 2正在应用于医学、网络安全分析等领域。目前,它还在后台为25款谷歌产品提供动力。

谷歌在一条推文中表示:“PaLM 2的模型在针对特定领域的数据进行微调时表现出色。(顺便说一句,微调=使用针对特定任务的示例来训练AI模型,使其在该任务上表现出色。)”

一个重大的公布是,谷歌现在将把其聊天机器人Bard提供给公众使用。它将在180多个国家提供,并将很快支持40多种语言。Bard已迁移到升级后的PaLM 2语言模型,因此应该能够继承所有能力上的改进。为了保存与Bard生成的信息,谷歌将允许用户将通过聊天机器人发出的查询和响应导出到Google Docs或Gmail。如果您是使用Bard进行编程的开发者,您可以将您的工作导出到Replit。

总而言之,今天主题演讲的主题很明确:人工智能正在帮助完成一切,并且在生成文本、图像和处理复杂查询方面越来越好,例如帮助对视频游戏感兴趣的人找到特定州可能设有他们感兴趣专业的高校。但就像谷歌搜索一样,Bard在不断进化,并变得越来越具有多模态性。在谷歌,他们的目标是尽快让Bard通过Google Lens在其响应和提示中包含图像。该公司正积极致力于将Bard与Adobe等外部应用程序以及各种工具、服务和扩展集成。

 

更多优惠、评测和购买指南

 
Charlotte Hu Avatar

Charlotte Hu

助理科技编辑

Charlotte 是《趣味科学》的助理科技编辑。她对了解我们与技术的关系如何变化以及我们如何在网上生活感兴趣。


© .