基于免疫进化算法优化卷积神经网络的强对流大风分级识别方法及其应用

论文

引用本文 [复制中英文]

罗玲, 张智察, 赵军平, 等, 2026. 基于免疫进化算法优化卷积神经网络的强对流大风分级识别方法及其应用[J]. 气象, 52(4): 454-464. DOI: 10.7519/j.issn.1000-0526.2025.061101.

[复制中文]

LUO Ling, ZHANG Zhicha, ZHAO Junping, et al, 2026. Identification Method of Different Levels of Severe Convective Winds with Convolutional Neural Networks Optimized by Immune Evolutionary Algorithm and Its Application[J]. Meteorological Monthly, 52(4): 454-464. DOI: 10.7519/j.issn.1000-0526.2025.061101.

[复制英文]

资助项目

浙江省气象局科技计划项目(2023ZDZL01)、浙江省自然科学基金联合基金资助项目(LZJMY25D050004、LZJMY23D050005、LZJMY23D050001)、浙江省科技厅“尖兵领雁”项目(2022C03150)、浙江省气象局科技计划项目(2024ZDZL02)、宁波市公益性项目(2025S111)和中国气象局复盘总结专项(FPZJ2024-051) 共同资助

第一作者

罗玲, 主要从事天气预报机理研究.E-mail: 76847787@163.com。

文章历史

2024年11月24日收稿
2026年1月22日收修定稿

Contents Abstract Full text Figures/Tables PDF

基于免疫进化算法优化卷积神经网络的强对流大风分级识别方法及其应用

罗玲 , 张智察 , 赵军平 , 陈列 , 黄旋旋 , 王丽颖 , 李文娟 , 罗然 , 彭霞云 , 黄娟

浙江省气象台, 杭州 310017

2024年11月24日收稿；2026年1月22日收修定稿

资助项目：浙江省气象局科技计划项目(2023ZDZL01)、浙江省自然科学基金联合基金资助项目(LZJMY25D050004、LZJMY23D050005、LZJMY23D050001)、浙江省科技厅“尖兵领雁”项目(2022C03150)、浙江省气象局科技计划项目(2024ZDZL02)、宁波市公益性项目(2025S111)和中国气象局复盘总结专项(FPZJ2024-051) 共同资助

第一作者：罗玲, 主要从事天气预报机理研究.E-mail: 76847787@163.com

摘要：强对流大风(简称强风)发生频次随风速增大而急剧减少的现象, 是导致现有各类算法难以对其进行分级识别的主要原因。为了解决该问题, 将不可微分命中率(POD)作为卷积神经网络(CNN)的损失函数, 偏差(Bias)为其约束条件, 利用多目标优化的免疫进化算法(MOIEA)优化CNN的所有模型参数, 提出了一种针对17.2、20.8、24.5 m·s^-1(分别对应8、9、10级风力)以上强风的分级识别算法(severe convective wind identification network, SCWINet)。SCWINet利用2022—2024年浙江省雷达垂直液态水含量、三维雷达反射率、闪电定位仪、分钟级地面自动观测站资料, 实现了时间分辨率为6 min、空间分辨率为0.01°的强风分级识别, 并与加权均方误差可微分损失函数和平衡均方误差可微分损失函数进行对比, 模型结构均一致。然后基于邻域法(扫描半径为5 km)的TS评分、Bias、POD、虚警率和强风平面分布特征探讨了SCWINet的适用性。主要结果如下: SCWINet能有效分级识别出系统性和分散性强对流系统对应的17.2、20.8、24.5 m·s^-1以上强风, 其中对系统性强对流触发的强风分级识别效果要优于分散性强对流。此外, 分级识别效果总体随强风风速的增大而降低, 空报和漏报的增大是造成上述现象的主要原因。加权均方误差和平衡均方误差损失函数则没有任何识别能力, 其识别出的风速均小于17.2 m·s^-1。未来可通过增加输入特征和数据量, 进一步提升其识别准确性, 并推广至更强风速的识别中。

关键词：临近预报强对流大风分级识别深度学习损失函数雷达

Identification Method of Different Levels of Severe Convective Winds with Convolutional Neural Networks Optimized by Immune Evolutionary Algorithm and Its Application

LUO Ling, ZHANG Zhicha, ZHAO Junping, CHEN Lie, HUANG Xuanxuan, WANG Liying, LI Wenjuan, LUO Ran, PENG Xiayun, HUANG Juan

Zhejiang Meteorological Observatory, Hangzhou 310017

Abstract: The serious imbalance in sample distribution, characterized by a sharp drop in the frequency of severe convective winds with increasing wind speeds, is identified as the predominant factor hindering the accurate intensity-based classification of severe convective winds by various existing algorithms.To address this problem, in this study the non-differentiable probability of detection (POD) is proposed to be the loss function for a convolutional neural network (CNN) and Bias to be its constraint condition. Subsequently, the multi-objective optimization immune evolution algorithm (MOIEA) is employed to optimize all the model parameters of the CNN. This contributes to the development of a novel identification algorithm, which is named severe convective wind identification network (SCWINet), for identifying severe convective winds at the speeds of 17.2, 20.8, 24.5 m·s^-1 and above. SCWINet leverages the radar vertical liquid water content, three-dimensional radar reflectivity, lightning location data and minutely surface automatic observation station data in Zhejiang Province during 2022-2024, achieving different levels of severe convective wind identification with temporal resolution of 6 minutes and spatial resolution of 0.01°. Then, the performance of SCWINet is compared to weighted mean-square error (WMSE) and balanced mean-square error (BMSE), which use the same CNN structure but have differentiable loss functions. The applicability of SCWINet is then assessed based on the threat score, Bias, POD, false alarm ratio that uses the neighborhood method (with a scanning radius of 5 km), and the planar distribution characteristics of severe convective winds. The main results are as follows. SCWINet can effectively identify severe convective winds of 17.2, 20.8, 24.5 m·s^-1 and above corresponding to systematic and scattered severe convective systems, with better performance observed in identifying severe convective winds triggered by systematic convection than those triggered by scattered convection. However, the identification effectiveness of SCWINet generally decreases as wind speed increases, with increased false alarms and missed detections being the primary causes of this phenomenon. By contrast, the commonly used WMSE and BMSE approach-es fail to identify severe convective winds, and all severe convective winds they identify are below 17.2 m·s^-1.Nevertheless, the data used in this study are somewhat limited in terms of the feature completeness and volume. Future enhancements in identification accuracy of severe convective winds could be achieved by incorporating additional features and data, such as radar radial velocity, specific differential phase, differential reflectivity, and satellite data. This could be also applied to identify even higher wind speeds.

Key words: nowcasting severe convective wind level identification deep learning loss function radar

引言

强对流大风(简称强风)指瞬时风速达到或超过17.2 m·s^-1并伴有雷暴的大风天气(风速≥17.2 m· s^-1、≥20.8 m·s^-1、≥24.5 m·s^-1分别对应风力8级以上、9级以上、10级以上)，由于其极强的突发性和致灾性，已严重威胁国民生命财产安全与社会经济发展(郑永光等，2016a；2016b；樊李苗和俞小鼎，2020)。然而，目前全球业务数值预报模式、中尺度数值模式对强风的预报能力仍然有限(杨新林等，2017；高帆等，2023)，因此，临近预报预警成为业务部门应对强风的最主要手段。虽然全国观测网的自动化及其时空精细化程度不断增加，临近预警技术不断完善，但仍很难满足强风的预报需求(郑永光等，2018)。因此，发展针对强风的预报预警技术具有重大现实意义(彭霞云等，2022)。

现有强风的识别技术主要基于气象专家总结的典型雷达特征展开，其主要可分为以模糊逻辑(李国翠等，2013)、支持向量机(杨璐等，2018)等传统识别算法和以全连接神经网络、卷积神经网络、循环卷积神经网络等的深度神经网络算法(周康辉等，2017；李海峰，2018)，上述方法在识别强风中取得了一定的成效，但目前仅能区分是否发生强风。迄今为止，针对强风的分级识别，尤其是针对不同等级强风的识别研究与业务应用极为少见。造成该问题的主要原因首先在于，传统客观识别方法本身性能有限，很难捕获引发强风的复杂非线性机制，其识别效果往往较差(方翀等，2014；周康辉等，2021；杨绚等，2022；王婷婷等，2023)。其次，强风存在严重乃至极端的样本不平衡问题，如24.5 m·s^-1以上大风相对较少见，这也严重制约了各类客观算法的适用性。

为解决上述强风分级客观识别中所存在的问题，进而为强风预报预警能力提供科学支撑。本文提出了一种针对17.2、20.8、24.5 m·s^-1以上强风的分级识别算法(severe convective wind identification network, SCWINet)。该算法采用不可微分命中率(POD)作为卷积神经网络(CNN)的损失函数，以偏差(Bias)为其约束条件，通过多目标优化的免疫进化算法(MOIEA)，优化了CNN的所有模型参数。为验证算法性能，将SCWINet与采用相同CNN结构的加权均方误差(WMSE)可微分损失函数和平衡均方误差(BMSE)可微分损失函数两种方案进行了对比。基于邻域法(扫描半径为5 km)，通过TS评分、Bias、POD、虚警率(FAR)等指标和强风平面分布特征，探讨了SCWINet的适用性。

1 资料与方法 1.1 资料

本研究选用了2022—2024年浙江省雷达垂直液态水含量、三维雷达反射率、闪电定位仪和分钟级地面自动观测站资料等多源观测数据。其中，浙江省三维雷达反射率通过8部S波段双偏振雷达组网得到，其时间分辨率为6 min，空间分辨率为0.01°，不同雷达距离均小于350 km。在组网拼图前，采用了基于深度学习的雷达质量控制方法，该方法基于U-Net模型架构，人工选取了2019年7—8月共计5000例单帧质量控制前雷达反射率，故模型的输入为单帧雷达反射率，其输出的对应真值标签为人工标记的非降水回波。将该数据集按顺序分为4000例训练集和1000例测试集。在训练阶段，初始学习率为0.001，模型共迭代100次，训练期间对学习率采用等间隔衰减策略以确保模型收敛至最优状态。最终，该方法对1000例测试集中非降水回波的识别精度达到80%。

由于实际业务中观测资料可能存在6~12 min延迟，因此本文采用过去两个相邻时刻(6 min、12 min或12 min、18 min)的资料来训练强风分级识别模型。其中，真实极大风资料为分钟级地面自动观测站取逐6 min时段内的极大风，并用闪电定位仪对极大风数据进行质量控制(表 1)。

表 1 强风样本筛选方法 Table 1 Filtering methods for severe convective wind samples

数据处理包含两个主要步骤: 空间插值和特征提取。首先，将自动站站点资料根据最邻近方法插值到格点上，若同一个格点存在多个站点风速，便取最大的风速值。然后，对数据进行质量控制(表 1)。诸多研究表明，基于雷达三维资料可提取出与强风发生所密切相关的垂直和水平空间特征(杨璐等，2018；沈杭锋等，2019；刘娜等，2021；周康辉等，2021)。为此，参照李海峰(2018)的研究方案，从三维雷达组网资料中提取了上述空间特征作为分级识别强风的因变量(表 2)。

表 2 用于分级识别强风的因变量 Table 2 The dependent variables used for identifying severe convective winds of different scales

质量控制后，用于模型训练的样本总数为11 625个。每个样本包含输入特征和标签风速，其中输入特征的数据维度为10×5×5，代表 10种特征在5×5的格点区域的分布，标签风速为5×5区域中心点处的自动站风速。训练样本总数中17.2 m·s^-1以上各风速阈值区间内样本数分布如图 1所示，可见强风样本频数随风速等级的增大而迅速降低，24.5 m·s^-1以上极端强对流大风样本占比仅为8.26%。测试数据来自2024年3—4月的强对流过程，共计119个时次(间隔为6 min)，每个时次覆盖716×814的网格区域，空间分辨率为0.01°。

图 1 不同风速等级强风样本的频率分布 Fig. 1 Frequency distribution of severe convective wind samples at different wind speed levels

1.2 基于“面对点”识别方案的数据集构建

现有针对强风识别的数据集构建方案主要有三种(表 3): “点对点”“面对点”“面对面”。由于强风的发生与对流系统的小微尺度时空特征密切相关(杨璐等，2018；沈杭锋等，2019；刘娜等，2021；周康辉等，2021)，无法提取空间特征，因此不宜采用“点对点”方案；其次，本研究仅有站点观测的强风资料，而缺少格点化的强风资料，故也未采用基于格点化资料的“面对面”方案，而是主要参考李海峰(2018)的研究，选择“面对点”方案，以5×5的格点区域来分级识别中心点的强风风速。

表 3 三种数据集构建方案的对比 Table 3 Comparison of three data construction schemes

1.3 检验方法

根据中国气象局智能预报技术方法竞赛检验方案，采用“面对点”检验方法，即以实况站点为中心点，扫描半径为5 km。检验评估指标采用TS评分、POD、FAR、Bias来评估针对强风的识别效果，上述指标能有效检验存在样本严重不平衡的强风分级识别能力。其计算方法流程为: 首先定义一组风速将最终的预测结果分解成多个二分类问题(大于阈值的点设为正例，反之设为负例)，然后根据二分类混淆矩阵计算评分。假设检验强风阈值为K(单位：m·s^-1)，本试验使用的K分别为17.2、20.8、24.5 m·s^-1。

$\mathrm{TS}=\frac{\mathrm{TP}}{\mathrm{TP}+\mathrm{FN}+\mathrm{FP}}$

(1)

$\mathrm{POD}=\frac{\mathrm{TP}}{\mathrm{TP}+\mathrm{FN}}$

(2)

$\mathrm{FAR}=\frac{\mathrm{FP}}{\mathrm{TP}+\mathrm{FP}}$

(3)

$\mathrm{Bias}=\frac{\mathrm{TP}+\mathrm{FP}}{\mathrm{TP}+\mathrm{FN}}$

(4)

式中：TP表示观测≥K且预测≥K的次数，FN表示观测≥K而预测＜K的次数，FP表示观测＜K而预测≥K的次数。

1.4 SCWINet

每一层的卷积核在提取输入特征的空间特征时，均会导致特征空间尺度的缩小，而用于分级识别强风的因变量空间大小仅为5×5，因此无法构建过深的卷积层。故本文以图 2所示的CNN结构分级识别强风，其参数量仅为8529，低于强风的训练样本量(11 625)，以此尽可能保证模型的计算效率与泛化性。根据表 2，CNN的输入特征数量总和为10，输入特征的空间区域大小为5×5，此后经过两次卷积与ReLU激活函数(Krizhevsky et al，2017)，将特征的通道数(C)分别扩展为32和16，特征空间尺度则分别缩小为3×3和1×1(H×W)，然后经过2个维度(Dim)为16的全连接层与ReLU激活函数，最后输出强风风速。

图 2 用于强风识别的CNN结构 Fig. 2 The framework of CNN for severe convective wind identification

SCWINet将不可微分的POD和Bias分别作为损失函数和约束条件。其中，以POD作为损失函数，代表模型在训练过程中的目标为仅提升POD，这虽能解决样本不平衡导致的强风难识别问题，但很可能会导致过大的空报，即Bias很大。为了约束空报问题，设置了Bias约束条件，使得POD和Bias相互制约。然而，POD和Bias不可微分，因此无法基于梯度下降法来更新CNN的所有参数。为了解决该问题，利用MOIEA代替梯度下降法来优化CNN的所有参数。

MOIEA训练SCWINet的具体实现流程如下。

$F(x)=1-\frac{1}{k} \times \sum\limits_{j=1}^k\left(\mathrm{POD}_{K_j}\right)$

(5)

$\max \left(\operatorname{Bias}_{K_j}\right) \leqslant 1$

(6)

$K_k= \begin{cases}17.2 & k=1 \\ 20.8 & k=2 \\ 24.5 & k=3\end{cases}$

(7)

式中F(x)为SCWINet的损失函数，x是待优化的参数，其对应为SCWINet的所有参数。当F(x)达到最小且满足式(6)的Bias约束条件时，SCWINet识别的不同等级强风的POD均值最高，此时其参数即为最优参数。MOIEA的原理详见倪长健等(2003)和钟琦等(2024)，本文不再赘述。在本文测试阶段和业务化应用部署时，数据经质量控制后格点仍存在雷达组合反射率因子在50 dBz以上且过去6 min仍出现17.2 m·s^-1以上强风，但SCWINet未识别的，则将该强风也作为当前识别强风。

1.5 基于加权均方误差(WMSE)损失函数的对比模型

常用的深度学习方法多采用可微分的损失函数，基于梯度下降法来更新模型参数。为了解决该条件下分级识别强风的样本严重不平衡问题，对比模型基于相同神经网络框架，其损失函数则采用了WMSE损失函数(Hu et al，2017；Zhang et al，2017；Fang et al，2020)。

WMSE相比于常规的均方误差(MSE)损失函数，在计算损失时考虑了目标值的大小。通过根据目标值的大小动态调整损失函数中各个样本的权重，使得大目标值和小目标值对损失的贡献相对平衡。因此，WMSE被广泛地运用于解决样本不平衡问题，以提高模型在处理不同范围目标值时的性能表现。

$\mathrm{WMSE}=\frac{1}{N} \sum\limits_{i=1}^N w_{j(i)}\left(y_i-\hat{y}_j\right)^2$

(8)

$w_j=\frac{N}{N_j}$

(9)

式中：N为总样本数，N_j为风速等级j的样本数，y_i和$\hat{y}_i$分别表示第i个样本的观测风速和预测风速，w_j(i)表示样本i所属风速等级j的权重，权重系数一般根据不同风速等级样本数量进行计算。

1.6 基于平衡均方误差(BMSE)损失函数的对比模型

Ren et al(2022)研究表明，当训练数据不平衡时，MSE会被标签分布所影响而倾向于预测常见的标签。为了解决回归问题中所存在的样本不平衡问题，基于极大似然估计法，得到可自适应不平衡数据分布回归问题的BMSE损失函数(Ren et al，2022)，如下所示：

$\mathrm{BMSE}=\frac{1}{N} \sum\limits_{i=1}^N \frac{\left(y_i-\hat{y}_i\right)^2}{p\left(y_i\right)}$

(10)

式中p(y_i)表示标签y_i在训练数据中的概率分布。在实际计算中，标签概率p(y_i)可以根据训练数据的风速分布进行估计，从而使样本数量较少的高风速样本在损失函数中具有更大的权重，进而提升模型对极端强风样本的学习能力。

2 检验结果 2.1 综合检验

WMSE和BMSE目前虽被广泛应用于缓解样本不平衡问题，但在本文训练和测试环节均发现，WMSE和BMSE的最大识别风速均小于17.2 m·s^-1，表明这两种损失函数所训练的模型均无法识别出强风，识别结果明显偏低。故以下仅分析SCWINet在测试集中的识别效果。

在5 km邻域检验半径的条件下(表 4)，SCWINet识别效果较好。但SCWINet分级识别效果随强风风速的增大而逐渐降低，FAR的增大和POD的降低是主要原因。为进一步评估SCWINet的适用性，结合了综合评分和强风平面分布对2024年3月25日14:12—17:12(北京时，下同)浙江的不同等级强风过程进行检验。

表 4 5 km邻域检验半径SCWINet的测试集检验结果 Table 4 Test results of SCWINet in test set based on 5 km neighborhood verification radius

2.2 2024年3月25日14:12—17:12强风过程个例检验

受高空槽、低涡切变、西南暖湿气流和冷空气共同影响，2024年3月25日14:12—17:12，浙江出现大范围强对流过程，并伴有8~13级分散性与系统性强风。从图 3和图 4a₁~4d₁可见，此次强风过程主要自西北向东南方向移动，最初为局地分散性强对流系统所引发的分散性强风(14:12—15:12)。此后随着系统发展，逐渐演化为线状对流所引发的系统性大范围强风(15:12—17:12)。另外，在绍兴东部等地仍伴有分散性强对流引发的强风(图 4b₁)。在非强组合反射率因子区域的高山站点则还有混合性大风(图 4a₁)。

图 3 2024年3月25日雷达组合反射率因子分布(a)14:12，(b)15:12，(c)16:12，(d)17:12 Fig. 3 Distributions of radar composite reflectivity factor at (a) 14:12 BT, (b) 15:12 BT, (c) 16:12 BT and (d) 17:12 BT 25 March 2024

从图 3可见，SCWINet能有效识别出强风的发生区域，但范围上有所空报。具体而言，在14:12，衢州、杭州西部等地有分散性强对流(图 3a)，其中衢州出现8~10级、杭州西部出现8级强风(图 4a₁)。15:12分散性强对流进一步发展，强度和范围明显增大(图 3b)，衢州东部出现8~11级，杭州西北部出现8~12级强风，杭州南部出现8级强风(图 4b₁)。16:12浙江西部出现线状对流，绍兴等地出现分散性强对流(图 3c)，在线状对流区域出现8~11级强风，主要位于丽水、金华等地(图 4c₁)。17:12西南—东北向线状对流(图 3d)所在的丽水、金华、宁波等地观测到大范围8~12级强风(图 4d₁)。对于上述实况出现强风区域，SCWINet均识别出8~10级以上强风，识别区域和强度与实况总体一致。

图 4 2024年3月25日(a₁~d₁)观测强风和(a₂~d₂)SCWINet识别强风的分布(a)14:12，(b)15:12，(c)16:12，(d)17:12 Fig. 4 Distribution of (a₁-d₁) observed severe convective winds and (a₂-d₂) SCWINet-identified severe convective winds at (a) 14:12 BT, (b) 15:12 BT, (c) 16:12 BT and (d) 17:12 BT 25 March 2024

在此次过程中，SCWINet也表现出了一定的提前识别预警能力，能提前识别出绍兴地区分散性强对流所触发的强风，提前时效总体可达20 min以上。主要表现为16:12实况无强风(图 4c₁)，但SCWINet识别出8~9级强风，个别为10级(图 4c₂)，此时可能会被认为空报。然而，该系统在东移过程中强度维持稳定，在16:32观测到8~9级强风，然后在16:42—17:06观测到10级以上强风(图略)，可见，16:12可考虑为提前预警。但SCWINet易漏报线状对流的前方强风区，主要原因在于，根据“面对点”的建模方案，SCWINet仅能识别强对流系统区域内的强风，而线状对流前方的漏报强风区很可能是由阵风锋、下垫面狭管效应所致(沈杭锋等，2019)，该类强风预警可能更需要通过强风临近外推或“面对面”的识别策略予以解决。

图 5是14:12—17:12期间逐6 min的各评分，可见SCWINet对各级强风具有较好的识别能力，但随着强风风速的增大，其识别效果与稳定性逐渐降低。此外，强对流类型的不同也是影响SCWINet识别效果的重要因素，即在分散性强对流为主的时段(14:12—15:12)，TS评分相对更低，Bias、POD和FAR相对更大。而此后各评分表现则总体相反，说明SCWINet更适用于线状对流等系统性强对流所触发的强风，而对分散性强对流所触发的强风相对更易空报。

图 5 2024年3月25日14：12—17：12 SCWINet对分级强风的识别评分 (a)TS评分，(b)POD，(c)FAR，(d)Bias Fig. 5 Time series of the identification scores of SCWINet for severe convective winds above scales 8-10 during 14:12-17:12 BT 25 March 2024 (a) TS, (b) POD, (c) FAR, (d) Bias

此外，从SCWINet的识别图中也可见，识别强风还可达到10级以上，但考虑到11级以上强风样本相对极少，对数据质量控制要求更为严格，因此针对11级以上强风的分级识别研究仍有待进一步深入，本文并未对其展开分析研究。但只要具备更多的11级以上强风样本，对式(7)加入相应的风速阈值，也可完成针对11级以上极端强风的分级识别。

3 结论与讨论

利用2022—2024年浙江省雷达垂直液态水含量、三维雷达反射率、闪电定位仪、分钟级地面自动观测站资料，将不可微分POD作为CNN的损失函数，Bias为其约束条件，然后利用MOIEA优化CNN的所有模型参数，据此提出了一种针对17.2、20.8、24.5 m·s^-1以上强风的分级识别算法(SCWINet)，其识别时间分辨率为6 min，空间分辨率为1 km。将SCWINet与采用相同CNN结构的WMSE可微分损失函数、BMSE可微分损失函数方案进行对比，最后基于邻域法(扫描半径为5 km)的TS评分、Bias、POD、FAR和图像分布特征探讨了SCWINet的适用性：

(1) SCWINet能有效识别出系统性和分散性强对流系统所触发的17.2、20.8、24.5 m·s^-1以上强风，其中对系统性强对流所触发的强风分级识别效果要优于分散性强对流。分级识别效果总体随强风风速的增大而降低，空报的增大是造成上述现象的主要原因。相比之下，WMSE和BMSE识别结果均小于17.2 m·s^-1，表明这两种可微分损失函数在强风分级识别中的应用难度相对较大。

(2) 强风数据集的构建仍存在一定的不准确，例如剔除非强对流大风样本，一定程度上也剔除了有利于消空的信息。虽然本文强风样本已存在严重乃至极端的不平衡问题，但该占比在实际中仍是明显偏高的。当强风样本占比极低，存在严重的类别不平衡时，在业务应用中漏报可能造成严重损失，可以容忍一定程度的空报。传统的加权损失函数(如WMSE)通过调整样本权重来平衡各类别的贡献，但权重的选择往往依赖经验。平衡损失函数(如BMSE)试图在类别层面实现平衡，但可能忽视了业务需求中对漏报和空报的非对称要求。相比之下，POD和Bias组合直接针对业务关心的指标进行优化，通过POD优化保证对强风事件的较高POD，同时通过Bias约束维持预测的空间分布合理性。更强的大风往往与更复杂的天气系统相关。强对流系统在发展到产生极端大风时，常常伴随多尺度天气系统的相互作用，如中尺度对流系统与局地地形、边界层结构的耦合等。本文所选用的雷达特征可能不足以完整刻画这些复杂的物理过程。特别是在系统快速发展阶段，现有特征可能无法充分捕捉到导致风速快速增强的关键因素，因此，针对强风客观识别及外推算法的研究中，未来应引入更多观测数据，例如速度场、差分传播相移率、差分反射率因子以及卫星观测资料等，以丰富模型输入特征。另外需要特别注意的是，受制于自动站观测网在山区乃至城区密集程度不够，以及下垫面环境因素阻挡等原因，实际可触发致灾性强风的对流系统可能观测不到强风出现，但算法可能会做出提前识别，这也可能会被认定为空报。因此，需研究对于此种现象如何对强风数据做出科学判识标记，构造更准确的数据集，进而强化算法学习能力。

(3) 本文探索了一种有效缓解样本不平衡问题的优化策略，以提升强风分级识别的准确性。在气象领域，尤其是强风分级识别任务中，样本不平衡问题常常导致模型难以准确捕捉少数类别的特征，进而影响预测的整体性能。尽管BMSE与WMSE等损失函数试图通过赋予少数类别更高权重来缓解这一问题，但在本文是无效的。此外，气象专家凭借多年的实践积累，能够在复杂的天气模式识别中发挥关键作用。因此，在气象领域应用人工智能技术时，将气象专家的主观预报经验与数学物理机制相结合是有效的优化策略，可以为人工智能模型提供更为精准的指导和约束，从而提升模型在处理样本不平衡问题时的鲁棒性和准确性。

参考文献

樊李苗, 俞小鼎, 2020. 杭州地区夏季午后雷暴大风环境条件分析[J]. 气象, 46(12): 1621-1632. Fan L M, Yu X D, 2020. Analysis on the environment conditions of afternoon thunderstorm in Hangzhou[J]. Meteor Mon, 46(12): 1621-1632 (in Chinese).

方翀, 郑永光, 林隐静, 等, 2014. 导致区域性雷暴大风天气的云型分类及统计特征分析[J]. 气象, 40(8): 905-915. Fang C, Zheng Y G, Lin Y J, et al, 2014. Classification and characteristics of cloud patterns triggering regional thunderstorm high winds[J]. Meteor Mon, 40(8): 905-915 (in Chinese).

高帆, 俞小鼎, 王秀明, 2023. 山东较大范围致灾雷暴大风的多普勒天气雷达特征[J]. 气象, 49(7): 790-804. Gao F, Yu X D, Wang X M, 2023. Doppler radar characteristics of wide-range damaging thunderstorm gales in Shandong Province[J]. Meteor Mon, 49(7): 790-804 (in Chinese).

李国翠, 刘黎平, 张秉祥, 等, 2013. 基于雷达三维组网数据的对流性地面大风自动识别[J]. 气象学报, 71(6): 1160-1171. Li G C, Liu L P, Zhang B X, et al, 2013. Automatic identification of ground thunderstorm gale based on the radar mosaic 3D data[J]. Acta Meteor Sin, 71(6): 1160-1171 (in Chinese).

李海峰, 2018. 基于雷达回波的雷暴大风识别算法研究[D]. 哈尔滨: 哈尔滨工业大学. Li H F, 2018. Research on identification algorithm of thunderstorm gale based on radar echo[D]. Harbin: Harbin Institute of Technology(in Chinese).

刘娜, 熊安元, 张强, 等, 2021. 强对流天气人工智能应用训练基础数据集构建[J]. 应用气象学报, 32(5): 530-541. Liu N, Xiong A Y, Zhang Q, et al, 2021. Development of basic dataset of severe convective weather for artificial intelligence training[J]. J Appl Meteor Sci, 32(5): 530-541 (in Chinese).

倪长健, 丁晶, 李祚泳, 2003. 免疫进化算法[J]. 西南交通大学学报, 16(1): 87-91. Ni C J, Ding J, Li Z Y, 2003. Immune evolutionary algorithm[J]. J Southwest Jiaotong Univ, 16(1): 87-91 (in Chinese).

彭霞云, 章丽娜, 刘汉华, 等, 2022. 冷涡底部对流引起的杭州湾极端大风形成机制分析[J]. 气象, 48(6): 719-728. Peng X Y, Zhang L N, Liu H H, et al, 2022. Formation mechanism of extreme winds in Hangzhou Bay caused by convection at the bottom of cold vortex[J]. Meteor Mon, 48(6): 719-728 (in Chinese).

沈杭锋, 方桃妮, 蓝俊倩, 等, 2019. 一次强飑线过程极端大风的中尺度分析[J]. 气象学报, 77(5): 806-822. Shen H F, Fang T N, Lan J Q, et al, 2019. Mesoscale analysis of the extremely damaging gale in a severe squall line[J]. Acta Meteor Sin, 77(5): 806-822 (in Chinese).

王婷婷, 朱文剑, 姚凯, 等, 2023. 2021年吉林中部一次极端雷暴大风的中尺度成因分析[J]. 气象, 49(10): 1215-1226. Wang T T, Zhu W J, Yao K, et al, 2023. Mesoscale analysis of an extreme thunderstorm gale in central Jilin Province in 2021[J]. Meteor Mon, 49(10): 1215-1226 (in Chinese).

杨璐, 陈明轩, 孟金平, 等, 2018. 北京地区雷暴大风不同生命期内的雷达统计特征及预警提前量分析[J]. 气象, 44(6): 802-813. Yang L, Chen M X, Meng J P, et al, 2018. Radar statistical characteristics and warning lead analysis of thunderstorm gales in different life periods in Beijing[J]. Meteor Mon, 44(6): 802-813 (in Chinese).

杨新林, 孙建华, 鲁蓉, 等, 2017. 华南雷暴大风天气的环境条件分布特征[J]. 气象, 43(7): 769-780. Yang X L, Sun J H, Lu R, et al, 2017. Environmental characteristics of severe convective wind over South China[J]. Meteor Mon, 43(7): 769-780 (in Chinese).

杨绚, 代刊, 朱跃建, 2022. 深度学习技术在智能网格天气预报中的应用进展与挑战[J]. 气象学报, 80(5): 649-667. Yang X, Dai K, Zhu Y J, 2022. Progress and challenges of deep learning techniques in intelligent grid weather forecasting[J]. Acta Meteor Sin, 80(5): 649-667 (in Chinese).

郑永光, 田付友, 孟智勇, 等, 2016a. "东方之星"客轮翻沉事件周边区域风灾现场调查与多尺度特征分析[J]. 气象, 42(1): 1-13. Zheng Y G, Tian F Y, Meng Z Y, et al, 2016a. Survey and multi scale characteristics of wind damage caused by convective storms in the surrounding area of the capsizing accident of cruise ship "Dongfangzhixing"[J]. Meteor Mon, 42(1): 1-13 (in Chinese).

郑永光, 田付友, 周康辉, 等, 2018. 雷暴大风与龙卷的预报预警和灾害现场调查[J]. 气象科技进展, 8(2): 55-61. Zheng Y G, Tian F Y, Zhou K H, et al, 2018. Forecasting techniques and damage survey of convectively driven high winds and tornadoes[J]. Adv Meteor Sci Technol, 8(2): 55-61 (in Chinese).

郑永光, 朱文剑, 姚聃, 等, 2016b. 风速等级标准与2016年6月23日阜宁龙卷强度估计[J]. 气象, 42(11): 1289-1303. Zheng Y G, Zhu W J, Yao D, et al, 2016b. Wind speed scales and rating of the intensity of the 23 June 2016 tornado in Funing County, Jiangsu Province[J]. Meteor Mon, 42(11): 1289-1303 (in Chinese).

钟琦, 张智察, 姚秀萍, 等, 2024. 应用物理结合的人工智能方法提升"21·7"河南极端强降水预报[J]. 中国科学: 地球科学, 54(5): 1680-1701.

Zhong Q, Zhang Z C, Yao X P, et al, 2024. Improved forecasting via physics-guided machine learning as exemplified using "21·7" extreme rainfall event in Henan[J]. Sci China Earth Sci, 54(5): 1680-1701.

周康辉, 郑永光, 韩雷, 等, 2021. 机器学习在强对流监测预报中的应用进展[J]. 气象, 47(3): 274-289. Zhou K H, Zheng Y G, Han L, et al, 2021. Advances in application of machine learning to severe convective weather monitoring and forecasting[J]. Meteor Mon, 47(3): 274-289 (in Chinese).

周康辉, 郑永光, 王婷波, 等, 2017. 基于模糊逻辑的雷暴大风和非雷暴大风区分方法[J]. 气象, 43(7): 781-791. Zhou K H, Zheng Y G, Wang T B, et al, 2017. Fuzzy logic algorithm of thunderstorm gale identification using multisource data[J]. Meteor Mon, 43(7): 781-791 (in Chinese).

Fang Y, Hu Y H, Shao M F, et al, 2020. Performance analysis of a backlight dimming method using weighted mean-square-error based on joint edge-saliency characteristics[J]. Displays, 61: 101927. DOI:10.1016/j.displa.2019.101927

Hu S D, Jin L, Wang H L, et al, 2017. Objective video quality assessment based on perceptually weighted mean squared error[J]. IEEE Trans Circuits Syst Video Technol, 27(9): 1844-1855. DOI:10.1109/TCSVT.2016.2556499

Krizhevsky A, Sutskever I, Hinton G E, 2017. ImageNet classification with deep convolutional neural networks[J]. Communi ACM, 60(6): 84-90. DOI:10.1145/3065386

Ren J W, Zhang M Y, Yu C J, et al, 2022. Balanced MSE for imbalanced visual regression[C]//2022 IEEE/CVF Conference on Computer Vision and Pattern Recognition. New Orleans, LA, USA: IEEE: 7916-7925.

Zhang S, Zheng W X, Zhang J S, et al, 2017. A family of robust m-shaped error weighted least mean square algorithms: performance analysis and echo cancellation application[J]. IEEE Access, 5: 14716-14727. DOI:10.1109/ACCESS.2017.2722464