

ChatGPT 的“表亲”刚刚被 NASA 聘用。2 月 1 日,NASA 和 IBM 宣布了两大组织之间的新合作,旨在将人工智能 (AI) 工具应用于气候科学,扫描研究文献以快速获取答案,并识别地球科学数据中的特征。
这远非 NASA 首次涉足人工智能,甚至也不是该机构首次与 IBM 合作。2014 年,NASA 与这家科技巨头合作,在 太阳动力学天文台 的传感器发生故障时,推断出太阳极端辐射的测量值。一年后,NASA 启动了一个夏季训练营,将科学家与硅谷工程师聚集在一起,称为 前沿发展实验室。
此外,自机器学习技术问世以来,NASA 各领域的科学家一直在自己的项目中利用这些工具,从 观测太阳 到 设计自主数据收集机器人。然而,随着人工智能的强大和复杂性的提高,单个研究人员越来越难以充分发挥这些工具的潜力。每次开始新项目时,许多 NASA 的工程师和科学家都会为每个数据集构建一个定制模型。为了解决这个问题,NASA 在 2020 年举办了一次关于人工智能的研讨会。它寻求解决大规模、极具挑战性的问题,比为每个问题构建一次性模型更宏大——而 IBM 的技术似乎非常适合他们的需求。
IBM 首席开发人员 Priya Nagpurkar 在新闻发布会上说:“我们都听说过并看到过广泛适用的机器学习模型(尤其是像 ChatGPT 这样的语言模型)的‘魔力’。我们正处于一个独特的时刻,是时候将这些进步应用于不同领域……并推进科学了。”
[相关:ChatGPT 有突破性吗?专家们说不。]
此次合作是首次将一种特定类型的人工智能——一种灵活、广泛适用的技术,称为基础模型,IBM 在其开发方面处于领先地位——应用于地球科学。IBM 代表 Danielle Cerasani 说:“虽然 NASA 和 IBM 讨论使用人工智能解决各种问题已有几年,但 IBM 的基础模型研究是此次合作的催化剂。”
正如在 最近的新闻稿 中所述,此次合作计划解决两个主要项目:根据科学文献回答问题,以及分析地球的大型数据集以识别模式和趋势。NASA 提供对其海量地球观测数据及其科学家的访问权,而 IBM 则提供人工智能开发专业知识和现有技术研究。
文献搜索基于类似于 ChatGPT 的技术,NASA 希望它能成为科学家们的超级高级搜索引擎。其关键卖点之一是,它的答案将附带引文——直接链接到它从中提取信息的期刊——不像其他工具那样更像一个神秘的黑箱。NASA 马歇尔太空飞行中心的高级研究科学家 Rahul Ramachandran 在新闻发布会上表示,这项技术最早可能在 2023 年中期准备就绪。
然而,一些科学家对此表示怀疑。纽约城市大学物理学家兼人工智能专家 Viviana Acquaviva 说:“模型总结信息和回答问题的能力,这对于更广泛的社区来说是最具创新性的方面,但也更容易产生偏见。我们已经看到了像 ChatGPT 这样的先进模型如何轻易地产生带有偏见或不正确但听起来合理且自信的答案。”例如,在谷歌新推出的 Bard 聊天机器人的广告中,人工智能错误地表示,詹姆斯·韦伯太空望远镜拍摄了第一张系外行星的照片,而此前欧洲南方天文台的甚大望远镜已经完成了这项工作。
与此同时, Acquaviva 认为,将人工智能应用于地球观测是此次合作在科学上更有趣的一半。NASA 拥有“世界上最大的地球数据档案——足以装满大约一百万部普通 iPhone”,他们希望通过 IBM 的模型更有效地对其进行排序。
Ramachandran 告诉记者:“我们的档案目前有 70 PB,预计几年内将增长到 250 PB……我们支持全球 70 亿用户访问我们的数据进行研究和应用。显然,考虑到我们拥有的数据规模,我们面临着一个大数据问题。”
他们希望利用新的人工智能技术轻松地跟踪全球的天气和自然灾害——从龙卷风路径到尘埃云,种类繁多。Ramachandran 设想了一个场景,即灾害响应团队可以快速分析飓风过后洪水的范围,从而能够提供更快、更有效的紧急援助。该团队计划首先分析一个称为 Harmonized Landsat Sentinel-2 的数据集,这是来自两颗强大的 NASA 卫星的观测组合。然而,这项工作才刚刚开始,Ramachandran 称其为“开放领域”的研究。
此次合作还打算公开发布他们通过这些项目开发的 कोड 和其他工具,供任何有兴趣使用的人使用。Acquaviva 说:“很高兴看到在创建一个包容性和跨学科社区方面取得进展,该社区可以使气候数据和人工智能工具更容易被科学家和公众获取。”