2. 中国气象局气候研究开放实验室,北京 100081
2. Laboratory for Climate Studies of CMA, National Climate Centre, Beijing 100081
短期气候预测是当今世界性难题,其方法大致可归纳为动力和统计两种。动力气候模式是短期气候预测的主要发展方向,然而目前在气候预测业务中统计方法仍然发挥着重要作用[1-2]。我国气候预测业务建设中强调动力与统计相结合的技术路线,近年来,我国气候预测业务中有很多物理统计和动力统计等方法的应用[3-9]。汛期预测是我国最为重要的气候业务,客观定量的汛期降水滚动预测方法极具挑战性,也是业务中急需的。“滑动相关—逐步回归—集合分析”是一种客观统计预测模型,考虑了因子与预测量之间的相关不稳定性,在传统的物理统计预测模型基础上有改进,已经在新疆北部地区汛期降水指数预测[10]、新疆棉花播期热量指数预测[11]、新疆主要棉区春季稳定≥10℃初日预测[12]、沙尘日数预测[13]以及阿克苏河出山口径流量预测[14]等方面做过尝试,有一定效果。以最新获得的环流监测分析资料为因子,尝试建立全国160站汛期降水逐月滚动预测模型,并对比分析预测效果,对改进和提高我国汛期预测水平有积极的意义。
1 资料与方法 1.1 资料全国160站的汛期(6—8月)降水量和74项月环流特征量指数均来自国家气候中心网站(http://ncc.cma.gov.cn/cn/member.php)。对资料进行预处理,计算了12个月的环流特征量指数持续时间分别为1个月、2个月、3个月、4个月、5个月、6个月的57种时间尺度的组合,共得到备选环流指数因子数4218(74×57) 个。3月中旬制作汛期预测时,用前一年3月到当年2月的月环流特征量指数为因子,在4月中旬(5月中旬)制作汛期滚动预测时,使用前一年4月(5月)到当年3月(4月)的月特征量指数为因子,实现了逐月汛期降水滚动预测。
1.2 统计集合预测方法及改进考虑到预测量与环流因子之间的相关不稳定性,毛炜峄等将集合分析与物理统计预测模型相结合,提出了“滑动相关—逐步回归—集合分析”预测方法并逐步改进[10-15]。优化后的物理统计集合分析预测方法的具体流程见图 1,主要步骤如下:
(1) 显著线性趋势的检验及滤除。对各站的汛期降水量序列进行蒙特卡罗[16]线性趋势的显著性检验,如果检测到n年来在0.05显著性水平下序列有显著的线性趋势,则滤去该序列的线性趋势,如果无显著线性趋势,则计算得到距平序列。对所有前期环流因子序列进行同样的线性趋势的显著性检验,滤去在0.05显著性水平下有显著趋势的环流因子的线性趋势分量,无显著线性趋势的因子则计算得到距平序列。
(2) 用滑动相关分析法选取建立初选因子库。分别对各滑动窗口的相关系数序列进行统计,第一,计算平均值,第二,计算均方差。满足下列条件之一的因子方可进入初选因子库:该因子与预测量之间的滑动相关系数平均值的绝对值超过了预测量在0.10显著性水平下的临界相关系数,而且滑动相关系数中的最后1个的绝对值不小于前一个,而倒数第2个相关系数超过预测量在0.10显著性水平下的相关系数临界值,同时,滑动相关系数的均方差不超过某临界值。随滑动窗口长度从小到大,均方差的临界值按等差数列从0.05到0.005降序排列。各滑动窗口长度下的不同显著性水平所对应的临界相关系数用蒙特卡罗检验法[16]确定。总样本数为n时,滑动窗口长度分别取15, 16, 17, …, n-1,对应有n-15个初选因子库。
(3) 建立初级回归模型。用逐步回归方法,以滤去显著线性趋势的降水量序列(或者距平序列)为因变量,以各初选因子库中的滤去显著线性趋势(或者距平处理后)的环流指数为回归因子,建模样本数取n,根据入选和剔除因子的F临界值不同可以控制最终入选因子个数的特点,每站的初值均确定为:F1=3.51、F2=F1-0.01,自动识别因子数并修改F临界值,使最终入选因子数以3~5个为宜。得到n-15个初级回归序列。
(4) 建立一级集合模型。用逐步回归法,再次以滤去显著线性趋势的降水量序列(或者距平序列)为因变量,将n-15个初级回归模型的拟合序列作为回归因子,自动识别并剔除高度自相关的因子。建模样本数mn1分别取30, 31, 32, …, n-1, n,可以得到n-30+1个一级集合序列。
(5) 建立二级集合模型。用逐步回归法,以降水量原始序列为因变量,以n-30+1个一级集合结果叠加上降水量线性趋势(或者平均值)的序列为回归因子,自动识别并剔除高度自相关的因子。建模样本数mn2取n,得到1个二级集合序列。
(6) 逐级反推寻找有显著统计关系的前期环流指数因子。从二级集合模型向初始环流指数因子库反推,逐级寻找入选模型的因子。即,入选二级集合模型的因子序列(一级集合模型结果)—入选一级集合模型因子序列(初级回归模型结果)—入选初级回归模型的因子序列(前期环流指数)。
(7) 模型入选因子数调试。重复(3)~(6) 步骤,分别将步骤(3) 中的初级逐步回归模型中的入选、剔除因子的临界值F1初值选为2.01和9.99,运行到步骤(5) 时可以得到第2个、第3个二级集合序列。
(8) 绘制全国160站年汛期降水量距平百分率预测值空间分布图。提取每个站预测年的汛期降水量预测结果,以1971—2000年平均值为基准,计算全国160站汛期降水距平百分率,绘制空间分布图。
2 2009年全国汛期降水预测及检验 2.1 2009年全国汛期降水量滚动预测结果根据图 1流程,在2009年3、4和5月,选用最新的环流特征量分别做了汛期降水滚动预测,预测结果以及2009年汛期降水实况的距平百分率分布见图 2。
空间距平相关系数(ACC)是国际上用来检验区域气候预测效果的常用指标。在2009年3月制作的预测值与实况之间的ACC为0.3017,在4月和5月制作的滚动预测值与实况之间的ACC分别为0.3311和0.3545,其中5月制作的滚动预测效果最好。以在5月制作的滚动汛期降水预测结果为例,图 3给出1961—2008年的拟合结果与实况的距平空间相关系数,同时还给出了2009年的预测结果检验。
选用国家气候中心多年来应用的业务评分PS[17],基本公式是:
$ PS=\frac{{{N}_{0}}+{{f}_{1}}{{N}_{1}}+{{f}_{2}}{{N}_{2}}}{N+{{f}_{1}}{{N}_{1}}+{{f}_{2}}{{N}_{2}}}\times 100 $ | (1) |
2009年全国160站汛期预测和两次滚动预测的PS评分分别为72.8、72.3和75.7分,以在5月份制作的滚动预测效果最好。
根据气预函〔2009〕141号文修订的短期气候预测业务评分PS,在2009年3、4和5月制作全国160站汛期降水预测的PS评分依次为69.2、69.4和71.3分。3次预测中,单站评定得100分的站数最多,占160站的26.3%~30.6%;单站评定为0分的站数最少,为0.0%~1.3%;在3次预测结果中,单站评定为100分的站数在逐步递增,以在5月制作的滚动预测最多;而得0分的站数在逐步递减,在5月制作的滚动预测结果中没有得0分的站(表 1)。以在5月制作的滚动预测效果最好。
2009年是我国汛期预测较成功的一年,国家气候中心会商后发布的预测业务PS评分为76分,超过平均预测水平(65分)11分,位居1978年以来的第3位[4]。国家气候中心对2009年参加会商的各单位的预测结果进行评估,同时也对使用各种方法(工具)制作的预测结果进行评定,“滑动相关—逐步回归”方法的预测业务PS评分和距平相关系数ACC在被评定的16种方法中都是最高的[4]。
3 近10年独立样本预测试验及检验以上分析结果说明“滑动相关—逐步回归—集合分析”方法在2009年全国汛期业务预测中的效果不错。由于汛期预测业务评分不稳定[18],用该方法作近年来汛期预测试验结果如何呢?进行了2001—2010年近10年的独立样本预测试验,计算方案稍作改进。选用1961—2000年(建模样本数n=40) 的160站汛期降水量和前期环流指数建立模型,可以得到2001—2010年的10年预测结果,以此类推,使用1961—2001年(n=41)、1961—2002年(n=42)、……、1961—2009年(n=49) 的样本建立模型,可以分别得到2002—2010年、2003—2010年、……、2010年即9, 8, …, 1年的全国160站汛期滚动降水预测结果,每年每一次预测时都更新每一个站的预测方程。近10年“第n+1年”预测试验的空间距平相关系数ACC、季节尺度预测业务评分PS以及异常级预测评分TS结果见表 2。
表 2中,近10年在3、4和5月起报的ACC分别为0.093、0.118和0.113,平均为0.108,以4月起报的0.118最高。10年中每年3次滚动预测的ACC平均值以2009年最高,达到0.336,同时2003年和2006年的3次预测效果较差,ACC均为负数。以4月起报的预测为例,2001—2010年10年独立样本试验的预测结果中(表 3),10个模型预测的“第n+1年”到2010年的距平相关系数ACC平均为0.098,用1961—2008年样本建立模型预测2009—2010年的结果最高,ACC平均为0.199,而用1961—2008年样本建立模型的结果最低,ACC平均为0.034。在每年的模型中,以2005年的效果最为显著,“第n+1年”预测的ACC为0.305,从“第n+1年”到2010年预测的ACC平均达到0.265。在近几年国家气候中心提交汛期会商的意见中,2003—2009年7年的ACC[19-23, 3-4]平均为0.031。从ACC角度分析,“滑动相关—逐步回归—集合分析”预测模型的预测能力高于国家气候中心近年汛期业务预测水平。
表 2中,近10年在3、4和5月起报的PS评分分别为66.2、67.1和66.8分,平均67.1分,同样以4月起报的得分最高。以4月起报的试报结果为例,2009年最高73.2分,2001,2005和2008年也超过了70分,2003年最低,仅59.7分。
以4月起报的预测为例,2001—2010年10年独立样本试验的预测结果中(表 4),10个模型预测从“第n+1年”到2010年的PS得分平均为66.4分,国家气候中心多年汛期预测水平为65分[19-23];用1961—2001年样本建立的模型预测2002—2010年的平均得分最低,为64.5分,其余9年的模型从“第n+1年”到2010年的预测结果的业务得分平均超过了65分。从业务评分PS角度分析,用“滑动相关—逐步回归—集合分析”方法建立的模型预测指标略高于国家气候中心近年来的汛期预测业务平均水平。
表 2中,近10年在3,4和5月起报的汛期降水异常级评分TS分别为0.162,0.169和0.205,平均为0.179,以5月起报的TS最高。以5月起报的评分为例,10年中有6年的TS超过了0.200,2009年最高达到0.271。近年来在国家气候中心汛期预测业务中应用效果较好的因子集成方法提供了异常级降水评分TS[24],2000—2009年汛期降水预测异常级评分TS为0.12~0.23,平均为0.154。从降水异常级评分TS角度分析,相对于近年来国家气候中心汛期预测业务水平,用“滑动相关—逐步回归—集合分析”方法建立的客观统计预测模型还是有一定预测能力的。
4 讨论“滑动相关—逐步回归—集合分析”方法是一种客观统计预测工具,2009年汛期预测以及近10年的独立样本预测试验结果表明,用该方法来制作全国160站汛期预测有一定的效果,有何原因呢?从统计建模思路、具体方案等方面做一些初步讨论。
(1) 分离了年代际与年际变化信息。近50年来,全国有些区域的汛期降水量时间序列存在显著的线性趋势,而环流指数中也有一些存在显著的线性趋势。如果不进行线性趋势的显著性检验而直接分析,入选的显著因子很有可能更多地反映了与预测量之间的线性变化趋势特征。建立统计模型做汛期预测时,滤除了预测量与环流因子的显著线性趋势,在最后环节将显著的线性趋势再叠加到预测量序列上。分离出显著线性趋势后,将统计建模的重点放在了捕捉年际变化的预测信息上,而显著的趋势变化来自原预测序列的趋势特征。
(2) 滑动相关初选因子。过去在建立统计模型时,追求预测效果好、模型稳定。相关不稳定对挑选因子有影响,建模样本数的改变也会使入选因子的回归系数产生变化甚至改变入选因子等。林学椿、林正炎、朱盛明等[25-27]专家早就提出了相关不稳定性及其在建立统计模型时的一些方案,可以在一定程度上优化预测模型。通过滑动相关选取较为稳定的因子,能够改进统计模型的预测效果。
(3) 引入了集合分析步骤。滑动相关建立多个初选因子库,采用不同的建模样本数建立模型给出不同的预测序列,增加了统计建模的不确定性分析,同时也为集合分析提供了基础。在统计预测模型中,综合了统计不稳定性分析和集合分析,或许能够多次从原始序列中提取对预测有价值的信息,从而能够改善模型预测效果。
(4) 每年每一次预测时都更新每一个站的预测方程。长期以来,在气候分析预测业务中强调时空匹配,季节预测主要分析大尺度乃至行星尺度的环流因子、外强迫因子等。分别建立各站的汛期预测模型,如果属同一个气候区,那么它们的汛期降水时间序列中则包含有相似的年际变化特征,同时也有一些不同特征。每年每一次预测时都更新每一个站的预测方程,得到的预测场很可能包含有比典型空间型更为细致的空间分布信息,对于改进汛期降水预测尤其是降水异常级预测效果是有贡献的。
以上分析工作侧重于建立数理统计预测模型的探索,下一步还需要深入分析选取因子的物理意义。很多研究已经揭示了大气环流系统的演变与异常配置与我国不同区域汛期(6—8月)降水异常联系密切[28-35],前期海温异常对汛期降水异常也有直接或间接的影响[36-37]。我国地域辽阔,分属多个气候带,引起不同区域汛期降水异常的环流成因存在差异,需要进一步研究大气环流以及大气外强迫源的前期演变特征与区域汛期降水异常之间的物理联系机制,改进预测模型效果。
5 结论(1) 建立并优化物理统计集合预测方法流程,用“滑动相关—逐步回归—集合分析”方法,以最新得到的74项环流特征量月指数为预测因子,在3,4和5月起报,建立了全国160站汛期降水量的物理统计集合分析预测模型的流程,每年每一次预测时都更新每一个站的预测方程。2009年汛期降水预测效果不错,以在5月制作的滚动预测得分最高。
(2) 近10年的独立样本预测试验及其检验结果显示,该方法预测的空间距平相关系数ACC、业务评分PS以及异常降水级预测评分TS均高于国家气候中心近年的汛期业务平均水平。“滑动相关—逐步回归—集合分析”方法具有一定的预测能力,在季节尺度气候预测等业务领域有较大的应用推广潜力。
(3) 需要加强数理统计与气候预测相结合的理论基础、统计建模的具体方案改进、预测模型计算方案优化调试、预报效果检验分析等领域的研究,不断改进客观统计预测模型,提高季节尺度气候预测业务水平。
致谢:感谢国家气候中心柯宗建博士帮助绘制了各要素的空间分布图。
[1] |
陈桂英, 黄嘉佑, 王会军.现有短期气候预测方法的检验、评估和集成研究//短期气候监测、预测、服务综合业务系统的研制[M].北京:气象出版社, 2000:3-12.
|
[2] |
李维京, 张培群, 李清泉, 等. 动力气候模式预测系统业务化及其应用[J]. 应用气象学报, 2005, 16(Suppl.): 1-11. |
[3] |
张培群. 2008年汛期旱涝预测评述[R]. 2009气候预测评论, 2009, 15: 1-13.
|
[4] |
艾孑兑秀. 2009年汛期旱涝预测评述[R]. 2010气候预测评论, 2010, 16: 1-11.
|
[5] |
李维京, 陈丽娟. 动力延伸预报产品释用方法研究[J]. 气象学报, 1999, 57(3): 338-345. DOI:10.11676/qxxb1999.032 |
[6] |
马振峰, 陈洪. T63月延伸预报在西南区域短期气候预测中的应用研究[J]. 应用气象学报, 1999, 10(3): 368-373. |
[7] |
陈丽娟, 李维京. 月动力延伸预报产品的评估和解释应用[J]. 应用气象学报, 1999, 10(4): 486-490. |
[8] |
林纾, 李维京, 陈丽娟. 月动力延伸预报产品在甘肃省的使用及评估[J]. 气象, 2004, 30(10): 22-26. DOI:10.3969/j.issn.1000-0526.2004.10.005 |
[9] |
江双五, 田红, 陈丽娟. 动力延伸预报产品释用方法的改进试验[J]. 应用气象学报, 2005, 16(6): 779-786. DOI:10.11898/1001-7313.20050602 |
[10] |
毛炜峄. 用前期大气环流指数预测新疆北部夏季降水的探讨[J]. 气象, 2009, 35(6): 91-98. |
[11] |
毛炜峄, 谭艳梅, 李新建. 北疆棉花播期热量指数预测研究[J]. 干旱区研究, 2008, 25(2): 259-265. |
[12] |
邹陈, 毛炜峄, 吉春容, 等. 用前期月环流指数预测新疆棉区稳定≥10℃初日[J]. 干旱区研究, 2010, 27(4): 621-627. |
[13] |
毛炜峄, 谭艳梅, 李锡福. 塔里木盆地沙尘多发季节沙尘日数与前一年大气环流指数的关系研究[J]. 干旱区地理, 2007, 30(6): 888-895. |
[14] |
毛炜峄, 王铁, 江远安, 等. 影响阿克苏河年径流量变化的前期大气环流指数因子研究[J]. 冰川冻土, 2007, 29(2): 242-249. |
[15] |
毛炜峄. 用滑动相关—逐步回归—集合分析方法制作全国2009年汛期预测的尝试[R]. 气候预测评论, 2009, 15: 72-77.
|
[16] |
施能, 魏风英, 封国林, 等. 气象场相关分析及合成分析中蒙特卡洛检验方法及应用[J]. 南京气象学院学报, 1997, 20(3): 355-359. |
[17] |
陈桂英, 赵振国. 短期气候预测评估方法和业务初评[J]. 应用气象学报, 1998, 9(2): 178-185. |
[18] |
钱维宏, 陆波. 我国汛期季度降水预报得分和预报技巧[J]. 气象, 2010, 36(10): 1-7. DOI:10.7519/j.issn.1000-0526.2010.10.001 |
[19] |
杨义文. 2003年汛期降水预测评述[R]. 2004气候预测评论, 2004, 10: 1-9.
|
[20] |
陈丽娟. 2004年汛期旱涝预测评述[R]. 2005气候预测评论, 2005, 11: 1-11.
|
[21] |
宋文玲. 2005年汛期旱涝预测评述[R]. 2006气候预测评论, 2006, 12: 1-11.
|
[22] |
柳艳香. 2006年汛期旱涝预测评述[R]. 2007气候预测评论, 2007, 13: 1-9.
|
[23] |
高辉. 2007年汛期降水预测评述[R]. 2008气候预测评论, 2008, 14: 1-9.
|
[24] |
宋文玲. 用因子集成法制作2010年夏季降水趋势预测[R]. 2010气候预测评论, 2010, 16: 45-46.
|
[25] |
林学椿. 统计天气预报中相关系数的不稳定性问题[J]. 大气科学, 1978, 2(1): 55-63. |
[26] |
林正炎. 相关系数的稳定性[J]. 数学的实践与认知, 1979(3): 21-25. |
[27] |
朱盛明. 相关系数稳定性分析方法及其应用[J]. 气象学报, 1982, 40(4): 497-501. DOI:10.11676/qxxb1982.054 |
[28] |
张庆云, 陶诗言. 亚洲中高纬度环流对东亚夏季降水的影响[J]. 气象学报, 1998, 56(2): 199-211. DOI:10.11676/qxxb1998.019 |
[29] |
赵汉光, 张先恭. 我国东部夏季雨带的气候分类及其环流特征[J]. 气象, 1993, 19(9): 3-8. DOI:10.7519/j.issn.1000-0526.1993.09.001 |
[30] |
张素琴, 林学椿. 副高持续异常对长江中下游夏季降水的影响[J]. 气象, 2000, 26(5): 27-31. DOI:10.7519/j.issn.1000-0526.2000.05.007 |
[31] |
龚道溢. 北极涛动对东亚夏季降水的预测意义[J]. 气象, 2003, 29(6): 3-6. DOI:10.7519/j.issn.1000-0526.2003.06.001 |
[32] |
赵振国, 廖荃荪. 冬季北太平洋涛动和我国夏季降水[J]. 气象, 1992, 18(2): 11-16. DOI:10.7519/j.issn.1000-0526.1992.02.002 |
[33] |
杨莲梅, 张庆云. 新疆北部汛期降水年际和年代际异常的环流特征[J]. 地球物理学报, 2007, 50(2): 412-419. |
[34] |
张友姝, 史玉光, 张恒德, 等. 新疆夏季降水异常的时空特征及北极涡与阻塞高压对其的影响[J]. 干旱区地理, 2007, 30(6): 879-887. |
[35] |
赵振国, 廖荃荪. 南方涛动与我国夏季降水[J]. 气象, 1991, 17(6): 33-37. DOI:10.7519/j.issn.1000-0526.1991.06.006 |
[36] |
魏香, 陈菊英. 新疆北部雨季降水对ENSO的响应[J]. 气象, 2002, 28(9): 22-27. DOI:10.7519/j.issn.1000-0526.2002.09.005 |
[37] |
谭艳梅. 新疆季降水与太平洋海温的相关分析[J]. 新疆气象, 2001, 24(5): 9-12. |