2. 中国气象局百色岩溶生态气象野外科学试验基地, 百色 533000;
3. 中国气象局武汉暴雨研究所 中国气象局流域强降水重点开放实验室/暴雨监测预警湖北省重点实验室, 武汉 430205;
4. 四川省气象台, 成都 610072;
5. 高原与盆地暴雨旱涝灾害四川省重点实验室, 成都 610072
2. Baise Field Research Station for Karst Ecological Meteorology, CMA, Baise 533000;
3. CMA Basin Heavy Rainfall Key Laboratory/Hubei Key Laboratory for Heavy Rain Monitoring and Warning Research, Institute of Heavy Rain, CMA, Wuhan 430205;
4. Sichuan Meteorological Observatory, Chengdu 610072;
5. Sichuan Key Laboratory of Heavy Rain and Drought-Flood Disasters in Plateaus and Basins, Chengdu 610072
2 m气温(T2m)是气象预报最基础的业务之一,其预报精度直接影响天气预警、能源调度与灾害防御等关键决策(李浙华等,2024)。准确的预报不仅能够为公众提供可靠的天气信息,还能为能源、农业生产和灾害防御等领域提供科学依据。尽管数值天气预报(NWP)模式随观测与算力提升而不断进步,但受限于物理参数化误差与地形响应不足等因素,其在复杂地形区、极端事件及长时效预报中预报能力仍有较大提升空间。为降低NWP模式误差,模式输出统计(MOS)等统计后处理方法被广泛应用。薛谌彬等(2019)通过动态滑动双权重平均订正法有效降低误差;赵瑞霞等(2020)与陈豫英等(2011)分别将MOS拓展至短时临近降水与延伸期气温预报,提升显著;齐铎等(2020)针对东北地区提出格点偏差订正方法,有效改善T2m预报偏差;吴启树等(2016)提出“准对称混合滑动训练期”改进建模样本,使福建T2m误差较原始产品降低40%;潘留杰等(2017)也验证了简易格点订正方法的有效性。但复杂物理参数化方案的不确定性、模式系统性误差以及数据间复杂非线性关系依然是制约T2m预报提升的瓶颈。
近年来,深度学习快速发展为气象领域发展带来新机遇,其通过构建非线性映射关系,能从数据中挖掘潜在的大气动力和热力的关联,张桃等(2024)基于长短期记忆网络(LSTM)构建赤道太平洋海表温度10天预报模型,表现良好;张延彪等(2022)构建了融合多气象要素的Fuse-CUnet模型,相比于传统预报订正方法,显著提升订正效果;卢姝等(2025)融合多类神经网络的模型在湖南复杂地形和极端高温中取得良好效果;陈鹤等(2022)利用全连接网络改善高海拔T2m订正效果;杨彬等(2024)构建的T2m预报ATFSAS模型较LSTM模型有显著提升;陈锦鹏等(2021)、陈训来等(2021)及庄潇然等(2023)基于卷积神经网络(CNN)、卷积门控循环单元(ConvGRU)等方法在降水临近预报中取得突破;杨绚等(2022)系统评述了深度学习在智能网格预报中的应用潜力。
以华为开发的盘古天气模型(Pangu-Weather)为代表的AI气象模型取得重要突破(Bi et al,2023),Pangu-Weather基于Transformer架构,在编码阶段通过三维卷积提取大气垂直与水平特征,解码则利用反卷积输出预报场;网络引入残差连接与高斯误差线性单元(GELU)激活函数缓解梯度消失并增强非线性建模能力,模型驱动数据采用全球范围的欧洲中期天气预报中心第五代再分析数据集(ERA5),水平分辨率为0.25°,包含5个近地面要素与13个等压面上的5个高空变量。模型可通过4种时间尺度(1、3、6、24 h)迭代生成预报时效为1~10 d及以上、水平分辨率为0.25°的全球多种气象要素场。相比于NWP,Pangu-Weather的T2m预报平均绝对误差降低10%~15%,且速度更快,约10 min完成1 h分辨率的未来96 h时效全球预报。然而此类模型在T2m的区域精细化预报中也面临一些挑战,例如由于模型缺乏对大气物理过程(如能量频散等)的显式融入,在长时效预报中易产生违背物理规律的解(Rasp et al,2018)。为此,研究者探索引入物理规律约束,例如将垂直速度显式嵌入模型,以提升降水预报鲁棒性(Chen et al,2024);以功率谱密度(PSD)与Kullback-Leibler(KL)散度等统计量约束预报的频域能量分布与概率特性(徐甜甜等,2021;Li et al,2019;刘云和王梓宇,2020),这为提升T2m预报提供了新思路。
基于上述背景,针对广西复杂地形区T2m精细化预报中NWP地形适应性差、AI模型高频失真及极端高温可靠性不足等问题,本研究提出一种融合Pangu-Weather预报产品(以下将该产品简称为PANGU)与统计量物理约束深度学习框架的T2m预报模型:PSD-Net。利用PANGU预报产品,结合地形高程数据及中国气象局陆面数据同化系统(CLDAS)实况数据(师春香等,2019)构建数据集。在损失函数中融入PSD和KL散度,以施加物理约束。其中,PSD损失用于优化T2m场的频域能量分布,以提升多尺度连贯性;KL散度损失约束预测温度分布逼近实况,以增强气温的预报可靠性。利用2024年覆盖广西范围的格点、站点资料,较为全面地评估了PSD-Net与对比产品的T2m预报表现。
1 数据资料和方法 1.1 数据资料本研究采用2019—2024年每日两次(08时、20时;北京时,下同)ERA5数据驱动Pangu-Weather输出96 h预报时效内的预报产品PANGU,研究区域(19.5°~26.5°N、104.2°~112.2°E)覆盖广西全域,水平分辨率0.25°,时间分辨率1 h。
用于对比的数据为2024年全年每日两次发布(08时、20时)的欧洲中期天气预报中心数值模式72 h时效内的T2m预报产品(以下将该产品简称为ECMWF),国家气象中心72 h时效内格点T2m指导产品(以下将该产品简称为SCMOC)。ECMWF水平分辨率为0.125°,时间分辨率为3 h;SCMOC水平分辨率为0.05°,时间分辨率为1 h。
网格实况数据采用2019—2024年CLDAS逐小时的T2m网格数据,水平分辨率为0.05°,其中2019—2023年数据用于模型训练,2024年数据用于预报产品检验。CLDAS产品基于多源观测与再分析数据融合,在复杂地形区域具有良好的空间连续性,在华南区域的平均绝对误差(MAE)约0.8~0.9℃,在广西区域的均方根误差(RMSE)约为0.4℃,可用性较好,但其误差随海拔升高逐渐增大,与站点观测在陡坡、山区等局部地形下仍存在一定差异(师春香等,2019;刘莹等,2021;龙柯吉等,2019)。站点检验的实况数据采用2024年广西区域91个国家级气象观测站(图 1)经质量控制后逐小时的T2m数据。
|
图 1 研究区域的海拔高度(填色)及广西区域91个国家级地面气象站(黑点) Fig. 1 Topography of the study area (colored) and the distribution of 91 national meteorological stations (black dots) in the Guangxi Region |
地形高程数据水平分辨率为0.05°。底图采用自然资源部审图号为GS(2024)0650号的标准地图,未作修改。
1.2 模型基础超分辨率生成对抗网络(SRGAN)是一种基于深度学习的图像超分辨率技术,其原理是采用多个残差密集块(RDB)组成嵌套残差密集块(RRDB)的生成器提取深层特征,能捕捉图像细节,生成更精细图像(Ledig et al,2017)。该原理同样适用于捕捉降尺度后T2m特征,通过特征订正使结果更接近实况。故本研究构建的PSD-Net以SRGAN的生成器为核心,旨在提取更高分辨率T2m特征,以提升预报准确性。
能量谱损失(LPSD)基于Welch(1967)提出的PSD计算方法,用于描述信号在频域上的能量分布,公式如下:
| $ \operatorname{PSD}(f)=\frac{1}{M \sum\limits_{n=0}^{N-1} w^2(n)} \sum\limits_{i=0}^{M-1}\left|\sum\limits_{n=0}^{N-1} x_i(n) w(n) \mathrm{e}^{-\mathrm{j} 2 \pi f n}\right|^2 $ | (1) |
| $L_{\mathrm{PSD}}=\frac{1}{N_f} \sum\limits_{i=1}^{N_f}\left[\mathrm{PSD}_{\mathrm{F}}\left(f_i\right)-\mathrm{PSD}_{\mathrm{O}}\left(f_i\right)\right]^2 $ | (2) |
式(1)中:N为每段数据的点数,取值64,xi(n)是信号的第i段的第n个样本值,w(n)是Hanning窗函数,M为总段数,取决于信号长度和重叠率,f为空间频率,j为虚数单位。式(2)中: PSDF(fi)和PSDO(fi) 分别为预报场和实况场在第i个频率点处的功率谱密度值,Nf为频率点个数33。引入LPSD的目的是使模型预报的T2m空间分布与实况保持一致,重视高频细节,避免只优化时域损失(如平均绝对误差)易导致高频细节丢失。
利用Kullback and Leibler(1951)提出的KL散度计算方法,衡量两个概率分布间的差异。则KL散度损失(LKL)计算公式如下:
| $ L_{\mathrm{KL}}=\sum\limits_{i=1}^{B=100} \mathrm{PD}_{\mathrm{F}}(i) \ln \frac{\mathrm{PD}_{\mathrm{F}}(i)}{\mathrm{PD}_{\mathrm{O}}(i)} $ | (3) |
式中:B为直方图数,本研究取值100,PDF(i)和PDO(i)分别为预报场和实况场在第i个直方图区间(bin)的概率估计值,引入LKL的目的是保留T2m部分概率属性,如T2m分布或类似高温等局部特征的频率,与实况匹配,从而确保T2m预报场在分布和变化趋势与实况场趋于相似。
鉴于此,PSD-Net的损失函数在LMAE基础上引入LPSD与LKL,得到加权总损失函数(LTOTAL),相关公式如下:
| $ \begin{aligned} L_{\mathrm{MAE}}=\frac{1}{n} \sum\limits_{i=1}^n\left|T_{\mathrm{F}}(i)-T_{\mathrm{O}}(i)\right| \end{aligned} $ | (4) |
| $ \begin{aligned} L_{\mathrm{TOTAL}}=\alpha L_{\mathrm{MAE}}+\beta L_{\mathrm{PSD}}+\gamma L_{\mathrm{KL}} \end{aligned} $ | (5) |
式中:LMAE为T2m预报场TF和实况场TO的平均绝对误差,α、β、γ为权重系数。通过LTOTAL增强多目标协同并提升模型性能、鲁棒性(Yang and Shami, 2020)。
1.3 模型结构采用2019—2023年PANGU产品中对应区域的T2m、850 hPa气温和比湿、500 hPa温度预报数据,结合地形高程数据以及起报时次的CLDAS实况场共6类作为模型训练的特征量,由于PANGU原始水平分辨率为0.25°,故在训练前将各个特征量通过双线性插值至0.05°,与地形高程、起报时CLDAS实况场一致,并对数据场进行归一化处理。PSD-Net模型(图 2)核心由8个级联的RRDB构成,每个RRDB由3个RDB嵌套组成,每个RDB通过5层密集连接实现多尺度特征融合。RDB每层通过3×3卷积核提取特征,采用带泄露线性整流函数(Leaky ReLU,负斜率0.2)增强非线性表达(Florek and Miłosz,2023)。RDB内部采用加权残差连接设计,将原始输入特征与5层卷积后的深层特征按1∶0.2的权重融合,缓解梯度消失。RRDB则将3个RDB的输出特征再次按相同权重比例融合后与自身输入叠加,进一步强化特征传递稳定性。模型实现从局部到全局特征提取,最终通过3×3卷积将64个通道特征映射至单通道输出,生成归一化T2m订正场。
|
图 2 PSD-Net架构示意图 Fig. 2 Schematic diagram of the PSD-Net architecture |
为确保学习样本量充足,PANGU的96 h预报时效内特征数据均纳入数据集,理论样本总量420 864个(2192 d×2个预报时次×96个预报时效),实际样本420 315个,数据完整率99.87%。其中2019—2023年共350 067个数据用于训练,从中随机选取20%作为验证集。2024年全年数据(70 248个)独立作测试集。训练过程中采用Adam优化器,学习率1×10-4。使用时,模型输入特征经PSD-Net生成归一化订正场,再经反归一化恢复量纲,输出最终预报产品。
1.4 预报产品预处理在检验前需对齐不同产品(PSD-Net、SCMOC、ECMWF、PANGU)的时空分辨率,因此,时间上将ECMWF从3 h线性插值至1 h;空间上,将ECMWF和PANGU均通过双线性插值至0.05°。由于PANGU存在数据延迟,其最临近起报时次的预报产品无法满足业务需求; 以20时起报为例,业务要求16时前完成未来7天预报,但20时起报的PANGU产品须待至次日03时才输出。因此,PSD-Net(PANGU)采用预报时效平移方案:将当日20时(或08时)发布的1~72 h时效预报产品,实际替换为当日08时(或前一日20时)起报的13~84 h时效预报产品进行检验。该方案兼顾了研究连续性与业务可用性。
1.5 检验方法本研究采用计算平均误差(ME)、平均绝对误差(MAE)、均方根误差(RMSE)、预报准确率(ACC)等4类指标(张强等,2009)从格点与站点两方面验证产品。格点验证:将预报场与CLDAS实况进行逐格点比对;站点验证:由于邻近插值评估结果略优于双线性插值,且插值效率上邻近插值亦更快(龙柯吉等,2019),因此站点验证中给出邻近法插值后的评估结果。计算公式如下:
| $ \begin{aligned} \mathrm{ME} =\frac{1}{n} \sum\limits_{i=1}^n\left(F_i-O_i\right) \end{aligned} $ | (6) |
| $\begin{aligned} \mathrm{MAE} =\frac{1}{n} \sum\limits_{i=1}^n\left|F_i-O_i\right| \end{aligned} $ | (7) |
| $ \begin{aligned} \mathrm{RMSE} =\sqrt{\frac{1}{n} \sum\limits_{i=1}^n\left(F_i-O_i\right)^2} \end{aligned} $ | (8) |
| $ \begin{aligned} \mathrm{ACC} =\frac{N_{\text {correct }}}{N} \times 100 \% \end{aligned} $ | (9) |
式中:Fi为预报值,Oi为实况值,Ncorrect和N分别为预报误差绝对值≤2℃的站点(格点)数与总站点(格点)数。ME、MAE和RMSE越趋近于0℃,ACC越趋近100%,代表更优。在计算ME时,辅以统计预报值与实况值差值为正、负的格点(站点)数量占比,以说明偏差。
1.6 损失函数权重确定及消融对比试验本节设计损失函数权重确定和消融对比试验。为确保模型评估的可比性,所有试验均在相同设定下进行:使用相同训练集,在5个训练周期(epoch)内完成训练,均以测试集的MAE、ACC作为评估指标。
为优化式(5)中的α、β、γ,采用网格搜索策略:(1)将LMAE的权重α固定为1.0,提供稳定的梯度预报误差基准与量纲(Yang and Shami, 2020);(2)LPSD的权重β经超参搜索,从0.1(弱约束)至0.9(强约束)取7个候选值:0.1、0.3、0.4、0.5、0.6、0.7、0.9;(3)LKL的权重γ也取7个候选值:0.1、0.2、0.3、0.4、0.5、0.7、0.9,匹配概率分布约束常规强度;(4)由此构建49种(β, γ)组合,对比后发现(表 1),最优组合为β=0.5、γ=0.3(MAE=1.06℃、ACC=85.26%),此时PSD约束与KL散度约束较平衡,既保持场空间结构特征,又确保概率分布合理。因此后续研究、试验均采用该组合。
|
|
表 1 最优排名前4组损失权重组合模型的T2m格点预报MAE和ACC对比 Table 1 Comparison of MAE and ACC of gridded T2m forecasts from four best-performing loss-weighted combination models |
为验证PSD-Net对细节提取的能力,特引入U-Net作为参照(组1):其编码器-解码器结构含4级下采样与上采样,通过跳跃连接融合多尺度特征,仅学习输入到输出的映射,损失函数仅保留LMAE, 无约束项。同时为量化LPSD、LKL独立贡献,设置4组消融试验(组2~组5)。结果表明(表 2),组5(即PSD-Net)为最优:较组1,MAE降低约5.9%,ACC提升约1.78个百分点;较组2,MAE降低了11.2%。
|
|
表 2 消融试验组(含PSD-Net)及U-Net的T2m格点预报MAE和ACC对比 Table 2 Comparison of MAE and ACC of gridded T2m forecasts between four ablation experiments (including PSD-Net) and U-Net |
进一步分析两类约束。功率谱密度引入对数L2距离(the L2 distance of logarithmic,lgL2),以衡量预报场与实况场在空间尺度能量分布上的差异;概率密度函数(probability density function,PDF)使用KL散度衡量与CLDAS实况PDF之间的分布偏差。两项指标均无量纲,且数值越小表示预报越接近实况。组5在高频段(尺度≤50 km)的能量明显增强(图 3a),其lgL2较所有对照组为最小,最接近CLDAS实况,可见其提升中小尺度高频结构准确性。由图 3b可见,组5的KL散度最低,在T2m≥ 25℃区域修正更明显,PDF更贴近实况曲线。PSD和KL散度协同使组5在lgL2和KL散度上均达到最优,精度与稳定性均提升。
|
图 3 消融试验组(含PSD-Net)及U-Net的T2m格点预报和实况对比(a)功率谱密度,(b)概率密度函数 Fig. 3 Comparison of gridded T2m forecasts from four ablation experiments (including PSD-Net) and U-Net with observations (a) PSD, (b) PDF |
根据2024年各家预报产品72 h预报时效内总体的检验结果(表 3),在格点预报中,PSD-Net表现最优,MAE与RMSE最低,ACC最高,且ME接近中性(0.02℃)。其余方法误差较大,且ME表现出不同偏差:ECMWF存在冷偏差(ME=-0.41℃,负值格点数量占比为59.8%);PANGU的ME为+0.17℃,但正值格点占比52.7%,表明其暖偏差空间分布不均;SCMOC的ME极小,但MAE却最大。
|
|
表 3 2024年PSD-Net与对比产品的72 h时效T2m预报主要评估指标 Table 3 ME, MAE, RMSE and ACC of 72 h T2m forecast products from PSD-Net as well as ECMWF, SCMOC and PANGU in 2024 |
在站点预报中,PSD-Net的MAE(1.09℃)与ACC仍为最佳,但较其格点预报表现下降,格点订正效果优于站点。ECMWF和PANGU的偏差特征在站点有所增大,其中:ECMWF冷偏差进一步增大(ME=-0.57℃,负值站点数占比64.4%),表现较差;PANGU表现为冷偏差,ME负值站点数占比52.42%;而SCMOC站点表现优于格点。
对比各家格点预报产品的PSD和PDF(图 4),PSD-Net表现最佳:lgL2(0.0092)与KL散度(0.0008)均为最小,表明其在逼近真实温度分布方面最优。SCMOC在PSD上表现次优,PDF上也较接近实况,与其ME近0℃对应,可靠性和可订正性较高。ECMWF与PANGU在PSD上的误差显著较大,在中小尺度上PSD频谱衰减快,空间细节刻画能力不足;二者在PDF上也存在明显偏差,PANGU的T2m≥25℃的部分较CLDAS偏高,ECMWF温度分布整体偏左。综上,PSD-Net在空间结构与统计分布两方面表现最优。
|
图 4 2024年PSD-Net与对比产品的72 h时效T2m格点预报和实况的对比 (a)功率谱密度,(b)概率密度函数 Fig. 4 Comparison of gridded 72 h T2m forecast products from PSD-Net as well as ECMWF, SCMOC and PANGU with observations in 2024 (a) PSD, (b) PDF |
分析各家产品的1~72 h时效预报偏差,格点和站点预报偏差趋势一致但前者偏差小于后者(图略),重点对格点预报偏差进行分析(图 5)。由图可见,PSD-Net始终保持最优,其格点MAE从仅约0.95℃缓慢升至1.20℃,RMSE增幅为31.8%。其余产品误差增大更明显:ECMWF站点MAE从1.25℃升至1.89℃,RMSE增幅约50%;SCMOC站点MAE则从1.28℃升至1.82℃;PANGU站点MAE由约1.10℃升至1.82℃,且部分时效出现明显的周期性“跳变”。分析表明,PANGU这一现象可能与模型在推理阶段采用多时间模型迭代的“贪婪策略”有关,不同推理步骤的累加可能导致误差在特定时效升高,例如8 h预报采用“6+1+1”三次推理,其误差可能高于采用“6+3”两次推理的9 h预报。在ACC方面,PSD-Net表现最优,其余产品ACC多集中在70%~80%且波动较大。综上,PSD-Net在预报准确性、误差稳定性及抑制周期性异常波动方面均表现较好,引入的PSD约束损失提升了PANGU预报场结构一致性。
|
图 5 2024年PSD-Net与对比产品的T2m格点预报(a)MAE、(b)RMSE和(c)ACC随预报时效的变化 Fig. 5 Variation with forecast lead time of (a) MAE, (b) RMSE, and (c) ACC of gridded T2m forecast products from PSD-Net as well as ECMWF, SCMOC and PANGU in 2024 |
进一步对各家预报产品不同时效段(1~24 h、25~48 h、49~72 h)的ME及ACC进行分析(图 6)。PSD-Net在各时段均保持稳定,平均ACC高于82%,ME接近中性。PANGU表现次之,各时段ACC维持在75%~80%,整体误差控制较好。SCMOC虽在整体T2m分布(PDF,图 4b)上与实况较一致,但站点误差离散度大、异常值偏多,表明其平滑作用较强,对局地性、温度变化(变温)捕捉能力仍有不足,未能有效响应短时较大变化。ECMWF则存在冷偏差,且ACC随预报时效下降。综上,PSD-Net通过功率谱与概率双重约束,在分布一致性和稳定性方面均优于其他产品。
|
图 6 2024年PSD-Net与对比产品的T2m站点预报在(a)1~24 h,(b)25~48 h,(c)49~72 h的ME(箱线)和平均ACC(柱状) 注:箱线箱体中横线为中位数,箱体上端及下端分别为第75%和25%分位值,触须的上端代表除异常值外的最大值和最小值,尾端实心点为超出第75%分位值差3倍距离异常值;图中红色虚线表示ME为0℃线。 Fig. 6 ME (box plot) and averaged ACC (bar chart) of station-based T2m forecast products from PSD-Net as well as ECMWF, SCMOC and PANGU in the time periods of (a) 1-24 h, (b) 25-48 h and (c) 49-72 h in 2024 |
对72 h预报时效的结果进行月度统计,分析格点(图 7)和站点(图略)表现。ECMWF:站点MAE (1.62℃)和RMSE(2.09℃)最高,ACC(68.7%)最低;格点MAE在冬季升至1.43~1.95℃,冬季预报较差。SCMOC:格点MAE(1.59℃)略差于ECMWF,6月最佳(1.38℃), 冬季在1.61~2.04℃。PANGU:相对稳定,且站点MAE(1.34℃)表现优于其格点(MAE约为1.49℃),显示其对站点适应性较好;PSD-Net:格点MAE(0.93℃)最低,其中夏季仅0.80~0.87℃、冬季在0.88~1.03℃且ACC(89.3%)为最优;但站点RMSE相较格点上升0.19℃。综上,PSD-Net在各项指标上优于对比产品,其在格点订正的表现较站点更好;各产品在夏季预报均优于冬季,季节特征明显;ECMWF及SCMOC的冬季预报能力较差。
|
图 7 2024年PSD-Net与对比产品的72 h时效T2m格点预报(a)MAE、(b)RMSE和(c)ACC的月变化 Fig. 7 Monthly variation of (a) MAE, (b) RMSE and (c) ACC of gridded 72 h T2m forecast products from PSD-Net as well as ECMWF, SCMOC and PANGU in 2024 |
对2024年各家产品站点误差的72 h预报时效的平均日变化分析(图 8),产品的ME差异明显,MAE与ACC呈现反相关系。ECMWF表现为冷偏差,其MAE在15—18时显著升高(超过2.1℃);SCMOC维持轻微正偏差,但MAE呈现“双峰型”日变化,在清晨和午后误差较大;PANGU的ME较小,但在傍晚前后误差出现明显加大,这可能与边界层热力及稳定度变化较大时段物理约束不足及变温阶段局地热力变化更大有关(Rasp et al, 2018);PSD-Net的ME在12—18时存在正偏差,但其余时段其MAE保持在较低水平(0.9~1.4℃),ACC始终较高,在日变化、稳定性方面最优。
|
图 8 2024年PSD-Net与对比产品的72 h时效T2m站点预报(a)ME,(b)MAE,(c)ACC的平均日变化 Fig. 8 Diurnal average variations of (a) ME, (b) MAE and (c) ACC of station-based 72 h T2m forecast products from PSD-Net as well as ECMWF, SCMOC and PANGU in 2024 |
对2024年站点超阈值的高温(T2m≥ 35℃)及低温(T2m≤0℃)事件进行统计,由于偏差波动大,经测试,对高温和低温事件的预报结果分别采用11个和4个预报时效的滑动平均进行处理,以分析偏差趋势(图 9)。在高温事件中,各产品在1~72 h预报时效的ME在-4~0℃波动,即对T2m预报偏低,且误差随预报时效而增加。PSD-Net的误差最小,表现最优;SCMOC次之,ME在-2~-1℃波动,MAE和RMSE均随时效而增大;PANGU的趋势与ECMWF相似,但ECMWF的MAE和RMSE偏差明显更大。在低温事件中,各家产品对T2m预报偏高,PSD-Net整体表现优于其他产品。SCMOC、PANGU和ECMWF趋势较一致,其中:SCMOC的MAE最低约1℃,RMSE最低约1.5℃,但在36 h预报时效之后RMSE上升,偏差加大;ECMWF在1~72 h时效的MAE在1~1.8℃波动;PANGU与之相近,但波动幅度相对较小。
|
图 9 PSD-Net与对比产品对2024年(a~c)高温, (d~f)低温事件的T2m站点预报的(a,d)ME, (b,e)MAE和(c,f)RMSE随预报时效的变化 Fig. 9 Hourly variations of (a, d) ME, (b, e) MAE and (c, f) RMSE of station-based T2m forecast products with forecast lead time from PSD-Net as well as ECMWF, SCMOC and PANGU during (a-c) high temperature and (d-f) low temperature events in 2024 |
针对2024年四家产品72 h预报时效的T2m格点误差进行空间分布评估(图 10),着重分析预报产品MAE和ME的空间分布。广西以喀斯特地貌为主(图 1),北部、西部为云贵高原边缘山地,地形起伏较大,中部、东部和南部沿海区域以平原为主,海拔较低,明显的地形梯度对不同产品T2m预报误差的空间差异具有显著影响。ECMWF:MAE的空间分布呈现显著的地形相关性,高值区集中于北部山地(最大值达5.7℃),这可能与起伏地形导致的热力过程模拟偏差有关;ME整体表现为冷偏差(均值-0.31℃)。SCMOC:误差空间格局与ECMWF相似但量值更大,MAE高值区同样显著,ME转为轻微正偏差(均值+0.14℃)。PANGU:MAE空间异质性最强,ME呈现明显暖偏差。PSD-Net:MAE均值降至约1.0℃,在复杂地形下空间变率最小,ME接近中性,显示出最优空间一致性;说明其表现最优且空间分布最均衡。
|
图 10 2024年PSD-Net与对比产品的72 h时效T2m格点预报(a, b, e, f)MAE和(c, d, g, h)ME空间分布 Fig. 10 Spatial distribution of (a, b, e, f) MAE and (c, d, g, h) ME of gridded 72 h T2m forecast products from PSD-Net as well as ECMWF, SCMOC and PANGU in 2024 |
进一步分析海拔高度与站点预报误差关联性,依据检验站所在海拔高度分区。Ⅰ区:海拔 < 200 m,样本量约310万;Ⅱ区:[200,500) m,样本量约115万;Ⅲ区:[500,1000) m,样本量约47万;Ⅳ区:>1000 m,样本量约5万。对各产品站点72 h预报时效指标统计后进行分区分析(表 4)。ECMWF:在各区MAE、RMSE处于中等水平,ME呈现负偏差;在Ⅱ、Ⅲ区误差随海拔升高而增大,表明其对中高海拔地形适应性有限;在Ⅳ区,偏差虽减小(ME为-0.50℃),但MAE、RMSE仍较高。SCMOC:整体表现略优于ECMWF,ME在低海拔区为正偏差,随海拔升高逐渐转为负值。PANGU:在Ⅰ区表现优于ECMWF和SCMOC,但随海拔升高,MAE和RMSE误差增幅最大,ME也在Ⅳ区出现较大误差(+1.36℃),不如ECMWF和SCMOC;原因可能是其用于训练的地形掩膜分辨率在0.25°(Bi et al, 2023),对区域地形的学习相对不足有关,未能充分学习区域热力特征,加之广西地形复杂,因此在陡坡、河谷过渡等区域出现偏差极大值。PSD-Net在4个分区表现最优,ME表现稳定,Ⅰ区MAE较PANGU降低18%。表明引入地形高程作为辅助特征,可增强模型对复杂地形的适应能力(Han et al, 2021),有效订正纯数据模型(PANGU) 在高海拔区的高估偏差。
|
|
表 4 2024年PSD-Net与对比产品的T2m格点预报在广西不同海拔分区的MAE和RMSE Table 4 MAE and RMSE of gridded T2m forecast products from PSD-Net as well as ECMWF, SCMOC and PANGU in different elevation ranges of Guangxi Region in 2024 |
高性能预报产品需兼顾平稳天气的稳定性与转折天气的预报准确性。选取2024年2月21—23日降温和3月3—5日升温过程作为转折性天气个例,分别检验评估2月21日20时、3月2日20时起报的各家预报产品对站点实况的误差(图 11)。
|
图 11 2024年(a,c)2月21—23日降温过程和(b,d)3月3—5日升温过程中PSD-Net与对比产品的T2m预报的24 h变温(a, b)与实况的对比,(c,d)MAE随预报时效的变化 Fig. 11 (a, b) Comparison of 24 h temperature change with observations and (c, d) variation of MAE of 24 h temperature change with forecast lead time for the T2m forecast products from PSD-Net as well as ECMWF, SCMOC and PANGU during (a, c) the cooling event from 21 to 23 February and (b, d) the warming event from 3 to 5 March 2024 |
2月21—23日,受冷空气南下影响,研究区域内出现雨雪冰冻天气,广西气象部门对此次过程也发布了低温蓝色、冰冻黄色、寒潮黄色等预警。降温初期(图 11a),ECMWF、PANGU和PSD-Net均能较好地报出降温趋势,而SCMOC在过程开始前高估降温强度(-10℃)。22日00时出现分歧:PANGU在06时高估负变温;ECMWF和PSD-Net趋势较准,其中PSD-Net最接近变温实况;SCMOC则从21日23时起持续低估变温幅度,在22日14时,观测的变温仍有-12.5℃,而SCMOC则为-6.4℃,偏差较大。从MAE分析(图 11c),PSD-Net和PANGU整体较低(分别为1.78℃、1.85℃),表现优于SCMOC和ECMWF(分别为2.50℃、2.60℃),后两者误差上升幅度大,其中SCMOC在25~26 h预报时效出现明显误差,稳定性相对不足。
3月3—5日受西南暖低压影响,广西出现显著升温。过程前期受弱冷空气补充影响出现小幅负变温,PSD-Net和PANGU成功预报出这一波动,而SCMOC和ECMWF未报出(图 11b)。升温开始后,PSD-Net和PANGU保持较高准确性,SCMOC和ECMWF则高估升温幅度2~3℃。至4日02时后升温趋势减弱,PSD-Net准确把握趋势,其余产品均出现不同程度低估。对MAE分析(图 11d),PSD-Net与PANGU总体MAE较低(分别为1.41℃、1.61℃),SCMOC和ECMWF则为2.27℃、2.38℃,且ECMWF的MAE在12 h预报时效后波动明显(2.0~4.0℃),稳定性较差。
综上,各产品在升温过程中表现优于降温过程;PSD-Net表现最优,物理约束保持波动能量分布与统计特性使得PSD-Net在变温过程中对T2m能量频散以及分布起到积极效果;PANGU虽偶现局部高估,但整体稳健;ECMWF与SCMOC误差偏高,对变温预报较差。
3 结论与讨论本文的PSD-Net模型通过融合Pangu-Weather预报产品,并在损失函数中引入功率谱密度(PSD)和KL散度作为约束,是一种融合物理约束的深度学习预报模型。通过对广西地区2024年T2m的预报检验,从总体误差、时效演变、月际变化、日变化、极端事件、空间分布、海拔分区和典型变温过程等方面,较为全面地评估了PSD-Net及对比产品的表现。主要结论如下:
(1) 全年检验结果表明,PSD-Net在2024年格点与站点的T2m预报均优于ECMWF、SCMOC及PANGU。格点预报方面,PSD-Net的MAE较PANGU降低了37.6%,ACC提升17个百分点;站点预报方面,PSD-Net的MAE较PANGU降低18.7%,ACC提升7.7个百分点。
(2) 不同预报时效段的检验结果表明,PSD-Net的MAE和RMSE随预报时效增长的幅度均小于ECMWF、SCMOC及PANGU;ACC方面,PSD-Net的1~24 h预报的结果稳定超过85%,25~72 h预报误差增长缓慢,72 h预报保持在82%,且误差受季节变化影响较小。
(3) 从预报误差的空间分布上看,PSD-Net在广西复杂地形区的预报误差明显小于ECMWF、SCMOC及PANGU。其格点预报的MAE在大部分区域为0.8~1.5℃,而ECMWF、SCMOC及PANGU在山区(尤其是北部山地)的MAE可达1.5~6.0℃。
(4) 对于高温(T2m≥ 35℃)及低温(T2m≤0℃)事件,PSD-Net的ME稳定在-1~1℃,MAE与RMSE波动更小,较ECMWF、SCMOC及PANGU偏差更小。
(5) 对于2024年2月降温和3月升温两次转折性天气过程个例,PSD-Net表现优于ECMWF、SCMOC及PANGU,相较而言,其对升温过程的订正能力优于降温过程。
PSD-Net为T2m精细化预报与AI天气模型产品后处理和应用提供新思路。但本研究仍有若干局限:权重系数未进行全样本的敏感性试验;研究基于2024年广西区域数据进行验证,在其他区域及更长时效的能力有待检验;所用PSD和KL散度在降水等其他气象要素的预报适用性仍需探索;个例仅选取两个变温过程,未来可增加不同类型天气(如强对流等)个例以全面检验模型适应性;此外,模型基于格点场训练,站点订正能力弱于格点,后续可引入可变形卷积构建“格点-站点”耦合机制以提升站点预报精度。
陈鹤, 蔡荣辉, 陈静静, 等, 2022. 基于深度学习方法的气温预报技术应用与评估[J][J]. 气象, 48(11): 1373-1383. Chen H, Cai R H, Chen J J, et al, 2022. Application and evaluation of temperature forecast based on deep learning method[J]. Meteor Mon, 48(11): 1373-1383 (in Chinese). DOI:10.7519/j.issn.1000-0526.2022.070101
|
陈锦鹏, 冯业荣, 蒙伟光, 等, 2021. 基于卷积神经网络的逐时降水预报订正方法研究[J]. 气象, 47(1): 60-70. Chen J P, Feng Y R, Meng W G, et al, 2021. A correction method of hourly precipitation forecast based on convolutional neural network[J]. Meteor Mon, 47(1): 60-70 (in Chinese). DOI:10.7519/j.issn.1000-0526.2021.01.006
|
陈训来, 刘军, 郑群峰, 等, 2021. 基于卷积门控循环单元神经网络的临近预报方法研究[J]. 高原气象, 40(2): 411-423. Chen X L, Liu J, Zheng Q F, et al, 2021. A study on radar echo nowcasting based on convolutional gated recurrent unit neural network[J]. Plateau Meteor, 40(2): 411-423 (in Chinese).
|
陈豫英, 陈楠, 王素艳, 等, 2011. MOS方法在动力延伸期候平均气温预报中的应用[J]. 应用气象学报, 22(1): 86-95. Chen Y Y, Chen N, Wang S Y, et al, 2011. Application of MOS method on pentad mean temperature prediction in dynamical extended range[J]. J Appl Meteor Sci, 22(1): 86-95 (in Chinese).
|
李浙华, 肖安, 郑丽君, 2024. 基于高分辨率数值预报和深度学习的地面气温预报研究[J]. 高原气象, 43(2): 464-477. Li Z H, Xiao A, Zheng L J, 2024. Research on surface temperature prediction based on high-resolution numerical prediction products and deep learning[J]. Plateau Meteor, 43(2): 464-477 (in Chinese).
|
刘莹, 师春香, 王海军, 等, 2021. CLDAS气温数据在中国区域的适用性评估[J]. 大气科学学报, 44(4): 540-548. Liu Y, Shi C X, Wang H J, et al, 2021. Applicability assessment of CLDAS temperature data in China[J]. Trans Atmos Sci, 44(4): 540-548 (in Chinese).
|
刘云, 王梓宇, 2020. 无偏KL散度算法对时空异常区间检测的优化研究[J]. 计算机工程与科学, 42(7): 1318-1324. Liu Y, Wang Z Y, 2020. Optimization of the spatio-temporal anomalous regions detection by unbiased KL divergence algorithm[J]. Comput Eng Sci, 42(7): 1318-1324 (in Chinese).
|
龙柯吉, 师春香, 韩帅, 等, 2019. 中国区域高分辨率温度实况融合格点分析产品质量评估[J]. 高原山地气象研究, 39(3): 67-74. Long K J, Shi C X, Han S, et al, 2019. Quality assessment of high resolution temperature merged grid analysis product in China[J]. Plateau Mountain Meteor Res, 39(3): 67-74 (in Chinese).
|
卢姝, 陈鹤, 陈静静, 等, 2025. 基于改进长短期记忆网络的湖南网格气温预报模型[J]. 气象, 51(4): 431-445. Lu S, Chen H, Chen J J, et al, 2025. Gridded temperature forecast model in Hunan based on improved long short-term memory networks[J]. Meteor Mon, 51(4): 431-445 (in Chinese). DOI:10.7519/j.issn.1000-0526.2024.022003
|
潘留杰, 薛春芳, 王建鹏, 等, 2017. 一个简单的格点温度预报订正方法[J]. 气象, 43(12): 1584-1593. Pan L J, Xue C F, Wang J P, et al, 2017. A simple grid temperature forecast correction method[J]. Meteor Mon, 43(12): 1584-1593 (in Chinese). DOI:10.7519/j.issn.1000-0526.2017.12.015
|
齐铎, 刘松涛, 张天华, 等, 2020. 基于格点的中国东北中北部2 m温度数值预报检验及偏差订正[J]. 干旱气象, 38(1): 81-88. Qi D, Liu S T, Zhang T H, et al, 2020. Grid temperature numerical forecast verification and correction over central and north region of Northeast China[J]. J Arid Meteor, 38(1): 81-88 (in Chinese).
|
师春香, 潘旸, 谷军霞, 等, 2019. 多源气象数据融合格点实况产品研制进展[J]. 气象学报, 77(4): 774-783. Shi C X, Pan Y, Gu J X, et al, 2019. A review of multi-source meteorological data fusion products[J]. Acta Meteor Sin, 77(4): 774-783 (in Chinese).
|
吴启树, 韩美, 郭弘, 等, 2016. MOS温度预报中最优训练期方案[J]. 应用气象学报, 27(4): 426-434. Wu Q S, Han M, Guo H, et al, 2016. The optimal training period scheme of MOS temperature forecast[J]. J Appl Meteor Sci, 27(4): 426-434 (in Chinese).
|
徐甜甜, 韩光洁, 邹岩, 等, 2021. 基于混合机器学习的电磁功率谱密度预测模型[J]. 太赫兹科学与电子信息学报, 19(4): 623-627. Xu T T, Han G J, Zou Y, et al, 2021. Electromagnetic power spectrum density prediction model based on hybrid machine learning[J]. J Terahertz Sci Electr Informat Technol, 19(4): 623-627 (in Chinese).
|
薛谌彬, 陈娴, 张瑛, 等, 2019. ECMWF高分辨率模式2 m温度预报误差订正方法研究[J]. 气象, 45(6): 831-842. Xue C B, Chen X, Zhang Y, et al, 2019. Bias correction method for the 2 m temperature forecast of ECMWF high resolution model[J]. Meteor Mon, 45(6): 831-842 (in Chinese). DOI:10.7519/j.issn.1000-0526.2019.06.009
|
杨彬, 马廷淮, 黄学坚, 2024. 基于注意力机制与自适应时序分解的气温预报模型[J]. 气象, 50(6): 723-732. Yang B, Ma T H, Huang X J, 2024. Air temperature forecasting model based on attention mechanism and AdaSTL[J]. Meteor Mon, 50(6): 723-732 (in Chinese). DOI:10.7519/j.issn.1000-0526.2024.031901
|
杨绚, 代刊, 朱跃建, 2022. 深度学习技术在智能网格天气预报中的应用进展与挑战[J]. 气象学报, 80(5): 649-667. Yang X, Dai K, Zhu Y J, 2022. Progress and challenges of deep learning techniques in intelligent grid weather forecasting[J]. Acta Meteor Sin, 80(5): 649-667 (in Chinese).
|
张强, 熊安元, 张金艳, 等, 2009. 晴雨(雪)和气温预报评分方法的初步研究[J]. 应用气象学报, 20(6): 692-698. Zhang Q, Xiong A Y, Zhang J Y, et al, 2009. Preliminary study on the scoring methods of cloud-free rainfall/snowfall and air temperature forecasts[J]. J Appl Meteor Sci, 20(6): 692-698 (in Chinese).
|
张桃, 林鹏飞, 刘海龙, 等, 2024. 利用长短期记忆网络LSTM对赤道太平洋海表面温度短期预报[J]. 大气科学, 48(2): 745-754. Zhang T, Lin P F, Liu H L, et al, 2024. Short-term sea surface temperature forecasts for the equatorial Pacific based on long short-term memory network[J]. Chin J Atmos Sci, 48(2): 745-754 (in Chinese).
|
张延彪, 陈明轩, 韩雷, 等, 2022. 数值天气预报多要素深度学习融合订正方法[J]. 气象学报, 80(1): 153-167. Zhang Y B, Chen M X, Han L, et al, 2022. Multi-element deep learning fusion correction method for numerical weather prediction[J]. Acta Meteor Sin, 80(1): 153-167 (in Chinese).
|
赵瑞霞, 代刊, 金荣花, 等, 2020. OTS、MOS和OMOS方法及其优化组合应用于72 h内逐3 h降水预报的试验分析研究[J]. 气象, 46(3): 420-428. Zhao R X, Dai K, Jin R H, et al, 2020. Comparison of OTS, MOS, OMOS methods and their combinations applied in 3 h precipitation forecasting out to 72 h[J]. Meteor Mon, 46(3): 420-428 (in Chinese). DOI:10.7519/j.issn.1000-0526.2020.03.013
|
庄潇然, 郑玉, 王亚强, 等, 2023. 基于深度学习的融合降水临近预报方法及其在中国东部地区的应用研究[J]. 气象学报, 81(2): 286-303. Zhuang X R, Zheng Y, Wang Y Q, et al, 2023. A deep learning-based precipitation nowcast model and its application over East China[J]. Acta Meteor Sin, 81(2): 286-303 (in Chinese).
|
Bi K F, Xie L X, Zhang H H, et al, 2023. Accurate medium-range global weather forecasting with 3D neural networks[J]. Nature, 619(7970): 533-538. DOI:10.1038/s41586-023-06185-3
|
Chen Y T, Wang Y, Huang G, et al, 2024. Coupling physical factors for precipitation forecast in China with graph neural network[J]. Geophys Res Lett, 51(2): e2023GL106676. DOI:10.1029/2023GL106676
|
Florek D, Miłosz M, 2023. Comparison of an effectiveness of artificial neural networks for various activation functions[J]. J Comp Sci Insti, 26: 7-12. DOI:10.35784/jcsi.3069
|
Han L, Chen M X, Chen K K, et al, 2021. A deep learning method for bias correction of ECMWF 24-240 h forecasts[J]. Adv Atmos Sci, 38(9): 1444-1459. DOI:10.1007/s00376-021-0215-y
|
Kullback S, Leibler R A, 1951. On information and sufficiency[J]. Ann Mathemat Statis, 22(1): 79-86. DOI:10.1214/aoms/1177729694
|
Ledig C, Theis L, Huszár F, et al, 2017. Photo-realistic single image super-resolution using a generative adversarial network[C]//2017 IEEE Conference on Computer Vision and Pattern Recognition (CVPR). Honolulu, HI, USA: IEEE: 105-114.
|
Li X F, Leglaive S, Girin L, et al, 2019. Audio-noise power spectral density estimation using long short-term memory[J]. IEEE Signal Process Lett, 26(6): 918-922. DOI:10.1109/LSP.2019.2911879
|
Rasp S, Pritchard M S, Gentine P, 2018. Deep learning to represent subgrid processes in climate models[J]. Proc Natl Acad Sci USA, 115(39): 9684-9689. DOI:10.1073/pnas.1810286115
|
Welch P, 1967. The use of fast Fourier transform for the estimation of power spectra: a method based on time averaging over short, modified periodograms[J]. IEEE Trans Audio Electroacoust, 15(2): 70-73. DOI:10.1109/TAU.1967.1161901
|
Yang L, Shami A, 2020. On hyperparameter optimization of machine learning algorithms: theory and practice[J]. Neurocomputing, 415: 295-316. DOI:10.1016/j.neucom.2020.07.061
|
2026, Vol. 52 
