英伟达发布天气模型CorrDiff,预测效率大涨

发布于 2025-2-28 10:23
浏览
0收藏

在全球极端天气事件愈发频繁的当下,从暴雨洪涝引发的城市内涝,到飓风肆虐造成的巨大破坏,精准的气象预测成为了保障社会安全与经济稳定发展的关键环节,也是AI应用的重要领域之一。


所以,英伟达的研究人员发布了最新天气预测模型CorrDiff,能将分辨率为25公里的大气数据细化至2公里,大幅提升了气象预测的精度,并且能预测输入数据中未包含的相关变量,例如,雷达反射率,这对于判断降雨位置和强度极为关键。


此外,相比传统使用CPU进行的高分辨率数值天气模式相比,CorrDiff的能源效率提高了10000倍,预测效率提升500倍。

英伟达发布天气模型CorrDiff,预测效率大涨-AI.x社区

英伟达发布天气模型CorrDiff,预测效率大涨-AI.x社区

CorrDiff模型的核心之一是扩散模型,通过得分匹配的概念学习随机微分方程整个过程包括前向和后向两个相互配合的过程。


在前向过程中,噪声会逐渐添加到目标数据中。随着噪声的不断增加,信号会逐渐被噪声淹没,最终变得与噪声难以区分。这一过程看似让数据变得更加混乱,但实际上是为了模拟数据在真实环境中的不确定性和变化性,为后续的反向过程提供多样化的起点。

后向过程则是利用专门的神经网络对添加噪声后的样本进行去噪。在去噪过程中,神经网络会根据所学的随机微分方程,逐步去除噪声,使样本逐渐恢复到接近原始目标数据的状态。


这个过程有点类似在迷雾中寻找正确的道路,神经网络通过不断地学习和调整,引导样本朝着准确表示原始数据的方向迭代优化。通过多次这样的前向和后向过程,模型能够逐渐生成高质量的预测数据。

英伟达发布天气模型CorrDiff,预测效率大涨-AI.x社区

此外,CorrDiff还受物理启发的两步式“校正扩散”,可同时实现多个变量在低分辨率和高分辨率气象数据之间的高保真映射,并进行新的通道合成。


第一步是回归,使用UNet进行预测,目的是近似条件均值。这一步就像是为后续的精确预测搭建了一个基础框架,它利用低分辨率的输入数据,通过UNet强大的特征提取和映射能力,初步预测出高分辨率数据的大致形态,为后续的精细化调整提供一个可靠的起始点。

第二步是生成,利用扩散模型进行校正。在这一步中,基于第一步得到的结果,扩散模型进一步对数据进行随机校正。它通过学习随机微分方程,在噪声逐渐添加和去除的过程中,不断优化预测结果,从而生成更加精细的细节,使最终的预测数据更接近真实的高分辨率数据分布。


这种将预测过程分解为均值预测和随机校正的方式,类似于流体动力学和气候数据分析中常用的将物理变量分解为均值和扰动的方法,有效降低了学习高分辨率数据分布的难度。

训练数据方面,CorrDiff使用了来自25公里分辨率的全球再分析数据或气象预报模型,如ERA5再分析数据。这些数据提供了大尺度的气象背景信息,为模型的预测提供了基础框架。


而目标数据是基于天气研究和预报(WRF)物理模拟器生成的高分辨率数据,分辨率达到2公里,比输入数据高出12.5倍。WRF模型通过动力降尺度的方式,结合地面降水雷达和其他传感器的数据同化,能够提供较为准确的区域千米级大气状态估计,为CorrDiff模型的训练提供了高质量的参考标准。

英伟达发布天气模型CorrDiff,预测效率大涨-AI.x社区

为了评估CorrDiff的性能,研究人员在多个气象基准上进行了综合测试。结果显示,CorrDiff模型在各项指标上表现出色。以雷达反射率预测为例,CorrDiff模型的CRPS得分为1.90,MAE得分为2.54;UNet的MAE为2.51,RF的MAE为3.56,ERA5由于没有雷达反射率数据未参与此项对比。


在2米温度、10米东向风速和10米北向风速的预测中,CorrDiff模型同样展现出较高的技能水平,其CRPS得分均低于其他基线模型,MAE得分也与表现较好的UNet相当或更优。


本文转自 AIGC开放社区  ,作者:AIGC开放社区


原文链接:​​https://mp.weixin.qq.com/s/_Y8EX0DvoZ7kxGGih_ALoQ​

收藏
回复
举报
回复
相关推荐