

2月份,欧洲中期天气预报中心(ECMWF)——一个在未来几周内预测全球天气状况的世界领先机构——悄然上线了地球上首个由人工智能驱动的、完全投入运行的天气预报系统。
新的人工智能预报在生成过程、速度和成本上都远远优于非人工智能预报,计算能耗减少了1000倍。而且,在大多数情况下,这些由机器学习驱动的人工智能预报也更准确。“目前机器学习模型的得分更高,”曾协助开发该中心人工智能预报系统(AIFS)的ECMWF波恩模型开发员Peter Dueben表示。改进的程度难以量化,但ECMWF表示,对于某些天气现象,AIFS比其最先进的基于物理的模型好20%。
雷丁大学的气象学家、计算科学学院院长Andrew Charlton-Perez预计,未来将有更多由国家气象机构和谷歌等公司运营的人工智能预报系统。“这个领域的发展速度简直令人难以置信,”他说。
人工智能正在推动气象学领域的一场革命,使得过去需要大量专家团队和巨型超级计算机才能完成的预报,现在可以在笔记本电脑上完成。更快、更便宜的预报生产意味着,没有自己气象部门或超级计算机的贫困国家也应该能够制作自己的定制预报。研究人员可以深入研究海量预报数据,分析其结果为何如此之好:人工智能可能看到了专家们错过的东西,例如,揭示了传统模型中未编码的天气物理学方面。
但这种方法也有潜在的缺点。气象学家表示,由于通常不清楚人工智能是如何做出决策的,因此其结果可能难以信任。他们补充说,随着气候变化将天气推入前所未有的领域,人工智能可能会失效。
目前,气象学家仍然需要这两种预报:人工智能依赖于较慢的超级计算机生成的大量数据。但关于这个过程是否会发生变化,以及人工智能是否最终会成为我们所需的一切,仍存在重大疑问。

尽管人们倾向于嘲笑天气预报的可靠性,但在过去50年里,天气预报已经取得了长足进步。Dueben表示,总的来说,天气预报的准确性每十年提高一天:换句话说,今天的六天预报与10年前的五天预报一样准确。
在19世纪,预报员会绘制天气系统图,并考虑过去的天气行为来尝试预测未来。到了20世纪初,研究人员大胆地提出,最好是采用基于物理的流体流动和热力学模型,通过数学方法来确定气流的走向。但直到20世纪60年代计算机出现后,“数值天气预报”才开始获得关注。1975年,ECMWF作为一个独立的政府间组织在英国成立,汇集欧洲资源来运行Cray计算机,并预测未来几周内的全球天气。如今,它在英国、德国和意大利设有中心。
如今,全球每天通过卫星或地面仪器进行超过2000亿次天气观测。计算机变得强大得多,对流体流动的更详细理解已被纳入其算法中。如今,国家气象服务机构利用数十公里像素的粗糙全球模型输出,将其用于制作分辨率更精细、本地化、短期内可达一公里左右的预报。英国气象局使用自己的超级计算机制作全球模型,并正在试验可达100米分辨率的区域模型。
由此产生的改进被称为科学界的“沉静革命”,其影响不像任何单一的突发性发现那样引人注目,但对社会的影响同样深远。如今,得益于人工智能,情况再次发生变化。“这是第二次革命,”Charlton-Perez说。
自2010年左右兴起以来,机器学习人工智能系统在从大量数据中发现模式方面非常出色。Charlton-Perez说,从某种意义上说,这意味着人工智能将天气预报带回了它的根源,回到了通过观察过去模式来预测未来的想法。
自2022年以来,几家主要科技公司和学术界发布了基于人工智能的天气预报系统:值得注意的是,谷歌Deepmind发布了GraphCast;加州理工学院的研究人员发布了一个名为FourCast的系统;中国华为公司开发了Pangu-Weather。此后,更多系统相继问世。目前还没有哪个系统投入运行并生成每日预报(即供他人使用的预报)。但许多研究人员将这些实验系统与黄金标准的数值天气预报进行了比较,发现它们总体上与数值天气预报一样好。2024年9月的一项研究对五个突出的基于人工智能的天气预报系统进行了评估,这些系统“具有可比性,在某些情况下甚至优于”ECMWF的数值预报系统——同时在计算效率方面要高出几个数量级。

尽管ECMWF的人工智能预报系统于今年2月才投入运行,但该中心已测试多年。“在过去两年里,我们从未见过机器学习模型出现灾难性的错误,”Dueben说。“我们对结果很满意,”他说,尽管它们的精度是普通预报的三倍,这限制了它们对小型天气现象的准确性。
特别值得关注的是,这些系统在应对极端天气事件时是否仍然准确。总的来说,人工智能系统在操作范围内的数据表现良好,但如果遇到完全不同的情况,它们可能会失控。然而,预测极端天气事件显然至关重要。
Charlton-Perez决定跟踪这些系统在“炸弹气旋”科林风暴(2023年万圣节导致北欧停电)上的表现。他和他在雷丁大学的同事选择这场风暴是因为它具有时效性(他们在风暴发生后一个月内就写了论文),而且它超出了人工智能的经验范围,无论是从人工智能训练的时间范围还是训练数据的范围来看:这是自1954年以来英伦三岛报道的最强龙卷风。人工智能系统再次表现得相当好。“我们印象非常深刻,”Charlton-Perez说。它在正确的大致位置预测了风暴,其中心气压和强度也大致正确。“我们发现它们未能获得正确响应的地方是地面附近风的详细结构和强度,”他说。
此后,出现了更好的人工智能系统。例如,谷歌在2024年底发布了首个集合人工智能天气预报系统,名为GenCast。重要的是,它生成了50个或更多不同的AI预报集合,以获得事件可能性的概率。它再次在准确性上超越了ECMWF的基于物理的集合系统。该中心也在开发自己的人工智能集合预报,但尚未投入运行。
所有这些人工智能天气预报系统都基于一个关键数据集ERA5进行训练,ERA5是ECMWF通过整合观测数据和早期的数值预报而生成的大型“再分析”数据集。这种方法有助于创建一个平滑无缝的数据集,其中包含地球上每个网格点的温度和压力等数值。
这意味着,即使人工智能预报非常出色,仍然需要劳动密集型的数值模型——为人工智能提供数据。这是ECMWF现在同时发布两种产品的原因之一。


但这最终可能会改变。剑桥大学及其同事的研究人员创建了一个名为Aardvark的开创性人工智能模型,它采用不同的方法:它仅使用真实的观测天气数据来生成预报。ECMWF也在开发自己的产品,该产品同样抛弃了模型输入,仅使用观测数据。然而,目前,它们的精度甚至比全球模型还要粗糙。“这真的很令人印象深刻,但还有很多工作要做,”英国气象局埃克塞特的首席气象学家之一Steven Ramsdale表示。
如果这些系统得到改进,它们可能会取代基于物理的预报。“这是一个价值百万美元的问题,”Dueben说。“有些人会说,50年后我们肯定会运行物理模型。而另一些人会说,‘为什么要这样做?’”
所有这些未来发展都至关重要的是持续获取世界各地基本的观测天气数据。2月份,特朗普政府解雇了美国国家海洋和大气管理局(NOAA)的800多名员工,该机构负责运营国家气象局。这让一些人,包括NOAA官员,担心该机构的国家数据收集和预报将因此受到影响。
Charlton-Perez表示,当预报建立在基本物理学之上时,很容易理解其逻辑并对其抱有信心。而对于统计学上的人工智能预报,由于缺乏透明的基础,这种情况已不再适用。专家们说,解决这个问题的办法是随着时间的推移继续测试这些模型,同时开发称为“可解释人工智能”(X.A.I.)的技术。这些是计算机科学方法,用于打开人工智能的黑箱,并逆向工程其内部运作。“可解释性是一个巨大的问题,”Ramsdale说。
Charlton-Perez说,他正与气象局合作开展X.A.I.项目,这是一种针对人工智能的实验性“脑部手术”。“如果我用手术刀去除先前的天气条件的一部分,这是否是导致风暴具有破坏性的关键因素?如果你探测一个特定的神经元,它会做什么?”他说,这些实验可能会揭示数值模型中缺失的新物理学方面。Ramdsale表示同意。“我们没有纳入我们对物理学的理解;[人工智能系统]有效地学习了它们自己的理解,”他说。这意味着它们可能会“发现我们以前从未见过的新关系,因为它们必须从头开始学习一些东西。”
那么,天气预报的最终准确度会达到什么程度?这很难量化。“我无法告诉你它将走向何方,”Charlton-Perez说,但“我们永远无法做出完美的天气预报,因为它是一个混沌系统。”
总的来说,人工智能只是又一个工具,将有助于使预报数据变得更好、更容易生产,为那些负担不起自己超级计算机的国家打开大门。然而,Ramsdale表示,人工智能不太可能在不久的将来取代物理模型,而且它永远不会取代人类的专业知识和责任:“我们仍然需要人们将数据转化为有用的建议。”