2. 广西气象台, 南宁 530022
2. Meteorological Observatory of Guangxi, Nanning 530022
随着数值预报业务水平的不断提高, 各类数值预报产品对预报员最终的综合预报影响越来越大。目前在省级以下台站的集成预报还是以经验为主, 兼有部分定量统计集成方法[1-2]。较为常用的定量统计集成方法有回归、平均和加权、典型相关等预报方法。这些常用的集成预报方法本质上是属于线性的顺序处理技术。为了提高模式输出的降水预报的精度, 使模式结果能满足不断提高的应用要求, 用神经网络方法替代传统的回归方法对结果进行后处理, 可以得到满意的结果[3], 美国国家天气局已经有几个人工智能系统投入使用[4], 如Gillispie研制了一系列人工神经网络系统, 其中定量降水预报网络(Quantitative Precipitation Forecast, QPF)已经投入业务使用。国内许多学者也成功地运用了神经网络进行降水、沙尘暴、大风等的预报[5-10]。曹晓钟等[5]采用自组织神经网络进行天气分型, 集成多种数值预报产品, 分型建模进行分级降水试报, 其结果优于单一模式。赵翠光[6]使用人工神经网络方法建立了我国沙尘暴短期预报模型, 输出我国有无沙尘暴的预报结果。
反向传播人工神经网络, 即BP(back-propagation)模型[11], 具有物理概念清晰、通用性好、拓扑结构灵活可变、非线性映射能力强的特点。理论已经证明, 一个3层的神经网络能够实现任意精度的连续函数映射[12]。本文在主分量分析基础上构造BP神经网络低维学习矩阵的预报建模方法, 浓缩预报信息, 降维去噪, 并针对神经网络方法在预报建模中存在的“过拟合”现象及提高泛化性能问题展开讨论, 以达到提高预报准确率的目的。
1 基本原理和方法 1.1 主分量分析方法(PCA)主分量分析方法(PCA)是利用降维的思想, 把原来多指标转化为少数几个相互独立的综合指标的一种多元统计分析方法, 该方法被广泛应用于大气科学的预报和研究工作中[13-14]。其基本思想是:设某一预报对象有n个预报因子X=(x1, x2, …, xn)T, 可以通过主分量分析方法构造n个新综合因子变量Z=(z1, z2, …, zn)T。每一个新综合因子变量是原因子变量的线性组合, 新综合因子变量之间是相互正交的, 即新因子之间的相关系数为零, 新综合因子变量的特征值明确表示了它对原因子组的贡献大小。
将主分量分析得到的新综合因子变量用于构造神经网络学习矩阵, 可以很直观地去掉特征值为零的对应的主分量, 因为这些主分量几乎没有包含原变量的信息, 只保留特征量相对较大的且与预报量相关程度高的主分量。另外在实际计算中可以发现, 一般前几个主分量具有更大的方差贡献且与预报量相关性较好, 由于主分量间是正交的, 所以最后确定的几个特征值大且与预报量相关高的主分量所构成的学习矩阵, 不会有多余的重复信息噪音影响。由上述分析不难发现, 利用主分量分析构造神经网络学习矩阵, 能很好地保留原全部因子的有用信息, 对原预报因子矩阵有很好的降维作用。
1.2 神经网络方法人工神经网络是一个可自动提取一组预报变量和另一组自变量之间非线性关系的数据处理系统, 该网络的建立过程称为人工神经网络的训练过程, 是用自适应算法递归迭代求解因变量与自变量之间的非线性关系。训练后的神经网络模型可用来估算或预报预测变量。到目前为止, 已经出现许多神经网络模型及相应的学习方法。其中反向传播神经网络模型(简称BP模型)是应用较广泛的一种, 这种模型在输入层和输出层之间插入若干个隐含层, 相邻层次之间的神经网络元之间用连接权系数作相互连接, 而各层内的神经元之间没有连接, 本文使用的神经网络模型只含1个隐含层, f(x)为网络激活函数, 采用S型函数:
$ f\left( x \right) = 1/\left( {1 + {{\rm{e}}^{-x}}} \right) $ |
具体的算法可参阅文献[15]。
2 集成预报建模 2.1 基本资料的处理本文选取的资料时段为2002年4—9月及2003年4—8月, 资料范围是广西11个主要城市, 个例标准为有超过3站日降雨量大于25 mm的降水过程。经统计共有150个个例, 其中120个样本用于预报建模, 30个样本用于方程检验。本文选取的子预报产品为国家气象中心T213、T639、广州区域中心中尺度预报模式和日本数值预报的降水预报产品。上述四种产品都是格点值, 为了与预报值形式相一致, 应用高斯权重插值方法, 把格点值插值到相应的11个城市点上。另外本文采用的评分方法为2005年中国气象局确定的《中短期预报质量检验办法(试行)》。
2.2 主分量学习矩阵模型的建立根据前述的主分量分析方法, 对上述各因子作主分量分析。以主分量特征值相对较大, 与预报量相关系数较高作为取舍标准, 确定神经网络学习矩阵的输入。表 1是南宁市降水量各主分量特征值及主分量与降水预报量的相关系数, 可以看出, 相对来说, 前三个主分量与预报量的相关系数较高, 并且相对应的特征值也较大, 第四个主分量的相关系数相对于第三个主分量小将近2个量级, 因此用前三个主分量来构造神经网络的学习矩阵。其他站点也有类似的结果。本文采用三层前馈网络计算方法, 隐节点数为3, 学习因子和动力因子分别取0.9和0.7。利用1.2节给出的公式, 对标准化的学习矩阵作反复的学习训练, 当学习矩阵训练达5000次时, 误差函数趋于稳定。由网络模型所确定的连接权系数及阈值可以得到相应的预报模型, 并以此确定的参数和网络结构作为未来独立样本和实际预报的模型, 在本文中也用于对历史样本的预报拟合对比分析。
集成预报的根本目的是要能够客观地综合所有子预报方程对预报量的预报信息, 而考察集成预报方法的有效性, 首先应该比较分析集成预报模型历史样本拟合率是否好于各子预报方程。由表 2可知, 对120个样本的降水预报历史拟合, 集成预报方法是其中最优的一种。在11个城市的拟合中, 有10个站点评分为最高, 总平均分也明显好于其他4种产品的平均值。这说明运用主分量人工神经网络方法所构造的集成预报模型, 对各类子预报产品有较好的集成优化效果。
在一般情况下, 预报模型对历史样本的拟合精度很高并不一定说明其预报效果也一定很好。统计预报方法在实际预报建模的应用中, 最大的障碍就是存在明显的“过拟合”现象, 因此预报模型是否存在“过拟合”现象, 是检验其应用价值的重要标准。
表 3为主分量人工神经网络集成预报模型与其他4个子预报产品对30个独立样本的预报评分结果, 由表 3可以看出3个特点, 一是集成预报的总平均评分是最高的, 在11个城市的预报中有6个名列第一, 在其余5个站点的预报评分也较高, 说明该集成方法具有较好的集成优化效果;二是相对而言, 桂南的集成预报效果优于桂北, 可能的原因是桂北地区降水主要受西风带系统影响, 降水机理规律性较强, 有线性变化特征, 而桂南地区降水机理较复杂, 非线性变化特征较明显, 因此采用具有非线性准动力系统特征的人工神经网络方法进行预报集成效果更显著一些;三是集成预报方法没有明显的过拟合现象, 无论是对各城市点或总的平均, 对历史的拟合预报与对独立个例的预报差异不大。
上述分析表明, 主分量神经网络集成预报模型不但没有明显的“过拟合”现象, 而且预报精度也明显好于各子预报产品。其主要原因是, 主分量神经网络预报模型所采用的预报因子是原因子群作EOF展开后的3个主分量, 它们不仅浓缩包含了全部预报因子的主要预报信息, 同时这3个主分量是正交的, 没有复共线性关系。由于根据3个主分量构造的神经网络预报模型, 其网络结构规模较小, 应用研究成果表明, 在能够包含预报量与预报因子间主要相关关系的条件下, 网络规模越小预报模型的预报性能越好。
4 小结(1) 主分量人工神经网络方法所构造的集成预报模型, 对几种降水数值预报产品有较好的集成优化效果。无论是对历史个例的拟合预报或对独立样本的预报, 集成方法皆优于各子预报产品。
(2) 桂南的降水集成预报效果优于桂北。
(3) 主分量人工神经网络方法所构造的降水集成预报模型, 无明显的“过拟合”现象, 这说明主分量神经网络预报模型使预报泛化能力有显著的提高。
[1] |
苗爱梅, 郭玉玺, 梁明珠, 等. 夏季分县降水量集成预报试验[J]. 气象, 2000, 26(5): 8-12. DOI:10.7519/j.issn.1000-0526.2000.05.002 |
[2] |
周家斌, 张福海. 一种汛期降水分布客观集成预报方法[J]. 应用气象学报, 2000, 11(6): 93-97. |
[3] |
Robert J K, Ana P B. Localized precipitation forecasts from a numerical weather prediction model using artificial neural networks[J]. Weather and Forecasting, 1998, 13(4): 1194-1204. DOI:10.1175/1520-0434(1998)013<1194:LPFFAN>2.0.CO;2 |
[4] |
曾晓梅. 国外人工智能技术在天气预报中的应用综述[J]. 气象科技, 1994(4): 4-10. |
[5] |
曹晓钟, 闵晶晶, 刘还珠, 等. 分类与集成方法在降雨预报中的应用[J]. 气象, 2008, 34(10): 3-11. DOI:10.7519/j.issn.1000-0526.2008.10.001 |
[6] |
赵翠光. 人工神经元网络方法在沙尘暴短期预报中的应用[J]. 气象, 2004, 30(4): 39-41. DOI:10.7519/j.issn.1000-0526.2004.04.010 |
[7] |
孙军波, 钱燕珍, 陈佩燕, 等. 登陆台风站点大风预报的人工神经网络方法[J]. 气象, 2010, 36(9): 81-86. DOI:10.7519/j.issn.1000-0526.2010.09.013 |
[8] |
钱莉, 兰晓波, 杨永龙. 最优了集神经网络在武威气温客观预报中的应用[J]. 气象, 2010, 36(5): 102-107. DOI:10.7519/j.issn.1000-0526.2010.05.015 |
[9] |
蔡敏, 黄艳, 朱宵峰, 等. 基于BP神经网络的地质灾害细网格预报模型[J]. 气象, 2009, 35(7): 95-100. DOI:10.7519/j.issn.1000-0526.2009.07.014 |
[10] |
张雪慧, 官莉, 王振会, 等. 利用人工神经网络方法反演大气温度廓线[J]. 气象, 2009, 35(11): 137-142. DOI:10.7519/j.issn.1000-0526.2009.11.018 |
[11] |
孙照渤, 谭桂容, 赵振国. 人工神经网络方法在夏季降水预报中的应用[J]. 南京气象学院学报, 1998, 21(1): 47-51. |
[12] |
Rumehart D E. Parallel distributed processing: Explorations in the microstructure of cognition[M]. Cambridge MA: MIT Press, 1986: 101-109.
|
[13] |
张邦林, 丑纪范, 孙照渤. 用前期大气环流预报对中国夏季降水的EOF迭代方案[J]. 科学通报, 1991, 36(23): 1797-1798. |
[14] |
丁裕国. 经验正交函数展开气象场收敛性的研究[J]. 热带气象学报, 1984(4): 316-325. |
[15] |
李学桥, 马莉. 神经网络工程应用[M]. 重庆: 重庆大学出版社, 1996: 37-44.
|