MindSpore AI科学计算系列 | MetNet3融合稀疏站点数据,实现提前24h天气预报
CSDN 2024-06-28 12:01:10 阅读 99
背景
准确预测未来几分钟到几周的天气是一项基本的科学挑战。目前,绝大部分气象机构采用传统数值模式进行天气预报,这些数值模式是基于大气的物理模型进行构建的,但同时这些模式本身也会受到计算成本的限制。深度神经网络为天气变化建模提供了另一种范式,一旦模型训练完成,神经网络可以在不到一秒的时间内做出预报,同时兼备非常高的时间分辨率和空间分辨率。与此同时,AI模型还可以直接从大气观测数据中进行训练,以此获得更贴近观测的预测效果。
2023年6月,谷歌研究院与DeepMind合作发布了最新的天气模型MetNet-3,与之前的MetNet和MetNet-2相比,MetNet-3的预报时效从8小时、12小时提升到了24小时,并且增加了预报变量,同时扩大了预报范围。
1、方法与实验
在近期大量涌现的AI气象预报模型中,如Graphcast、盘古气象大模型,均采用再分析数据作为训练样本,即通过背景场与观测同化后的数据。相较于这些中期预报模型,MetNet-3选择引入一部分大气观测数据来进行模型的训练和评估。然而观测数据与再分析数据不同的是,观测数据来源多样且异构,数据存在不同程度的稀疏性。为了融合大气观测数据(稀疏点状数据),MetNet-3采取了一种Densification方式,这种方法将数据同化与模拟预测直接在AI模型中进行融合,Densification的过程如图1所示。
图1 Densification训练方式
Densification的目的是利用站点观测数据,预测所有位置上的基础气象要素。首先将所有站点取80%作为训练站点,20%作为验证站点,这20%的站点是不参与训练的,只参与精度验证;在实际训练中,随机mask25%的站点,然后输出所有训练站点的气象要素,并计算loss;然后在模型验证阶段,会把所有的训练站点都输进去,在所有验证站点上验证精度。最后在模型推理阶段,模型将所有的站点都作为输入,输入全部位置的预测值。
MetNet-3整体网络架构如图2所示,MetNet-3选择Unet作为backbone,由于数据集部分包含了两种分辨率,因此在Unet输入中,首先输入4km分辨率的数据,并在一次DownSample后加入8km分辨率数据,实现两种分辨率数据的融合。其次,MetNet-3在Unet中加入了MaxVit模块,主要考虑利用grid attention来捕捉一些全局信息。模型最终有三个输出,在4km的分辨率下会输出600多个同化的基础要素和稀疏的站点数据。在模型的最终输出层,数据会UpSample到1km的降水数据上。值得注意的是,模型虽然会输出同化结果作为loss用来约束整个模型,但是模型的评估里并不会考虑这些要素的预测质量。
图2 MetNet-3模型架构
另外,实验也发现如果同时训练这些变量,降水的预报质量和其他地面要素的预报质量会存在trade off,因此MetNet-3采取的训练策略是先减少OMO的损失权重训练降水要素,然后在把权重扩大100倍来进行模型微调。
2、结论与感谢
MetNet-3是一种新型的AI天气预报模型,可以对核心天气变量进行提前24小时的预报,其性能优于最先进的数值模式。目前MetNet-3已投入运行,可生成实时12小时降水预报,这些预报现已在与天气相关的Google产品中提供服务。
往期回顾
MindSpore AI科学计算系列 | 化学深度学习模型ChemGPT的性能评估公式拟合
MindSpore AI科学计算系列 | GNN-MoM基于昇思MindSpore Elec的图残差学习电磁求解器
MindSpore AI科学计算系列 | VAE基于MindSpore Elec的特征域MT反演,提升大地电磁反演的精度和分辨率
MindSpore AI科学计算系列 | Allegro提升昇思分子势能预测准确性,将上线MindSpore Chemistry
本文标签
声明
本文内容仅代表作者观点,或转载于其他网站,本站不以此文作为商业用途
如有涉及侵权,请联系本站进行删除
转载本站原创文章,请注明来源及作者。