

今天,Facebook 的母公司 Meta 宣布与英伟达合作,共同打造一台用于驱动其人工智能研究的超级计算机。他们将这台新机器命名为 RCS,代表人工智能研究超级集群 (AI Research SuperCluster)。
该超级计算机将于今年晚些时候完工,公司在 新闻稿 中表示,预计其“一旦在 2022 年年中全面建成,将成为世界上最快的人工智能超级计算机”。
Meta 表示,该超级计算机可以帮助其研究人员将更多数据输入人工智能模型,使其能够处理多种语言,从而 分析文本、图像和视频,可能用于翻译目的或识别有害内容。Meta 已开始 训练这些计算机进行自然语言处理和计算机视觉。
公司研究人员在 一篇博客文章 中写道,他们设想这项技术有一天可以为参与 AR 游戏或研究项目的国际团队提供实时翻译。它还将用于开发可以集成到增强现实和虚拟现实中的新工具。
[相关:Facebook 对周一的大规模宕机事件给出了解释]
不出所料,这个强大的新集群旨在帮助公司实现元宇宙。“我们为 元宇宙 构建的体验需要巨大的计算能力(每秒 quintillions 次运算),”Meta 首席执行官马克·扎克伯格在一份声明中表示,“RCS 将能够支持新的 AI 模型,这些模型可以从数万亿个示例中学习,理解数百种语言,等等。”
早期对 RCS 的研究表明,与 Meta 以前使用的系统相比,它“可以使计算机视觉工作流程运行速度提高 20 倍,NVIDIA Collective Communication Library (NCCL) 运行速度提高 9 倍多,并能以三倍的速度训练大规模 NLP 模型”。研究人员写道:“这意味着一个拥有数十亿参数的模型可以在三周内完成训练,而以前需要九周。”
[相关:这台超级计算机每秒将执行 1,000,000,000,000,000,000 次运算]
该公司长期以来一直致力于构建一个能够处理高达艾字节 (exabyte) 数据集的基础设施,该公司表示这相当于“36,000 年的高质量视频”。Meta RCS 超级计算机目前拥有 760 台 NVIDIA DGX A100 系统作为其计算节点,总计 6,080 个 图形处理器 (GPU)—其目标是在今年晚些时候将该数量增加到 16,000 个。
此外,这些 GPU “通过 NVIDIA Quantum 200Gb/s InfiniBand 网络连接,可提供 1,895 拍浮 (petaflops) 的 TF32 性能,”英伟达在一份随附的 新闻稿 中详细说明。
Meta 表示,这个新的训练模型 保护隐私,并且“使用加密的用户生成数据,直到训练前才解密”。该系统还“与更大的互联网隔离,没有直接的入站或出站连接”。