快速检索
  气象   2020, Vol. 46 Issue (1): 108-118.  DOI: 10.7519/j.issn.1000-0526.2020.01.011

论文

引用本文 [复制中英文]

祁海霞, 彭涛, 林春泽, 等, 2020. 清江流域降水的多模式BMA概率预报试验[J]. 气象, 46(1): 108-118. DOI: 10.7519/j.issn.1000-0526.2020.01.011.
[复制中文]
QI Haixia, PENG Tao, LIN Chunze, et al, 2020. Probabilistic Forecasting of Precipitation over the Qingjiang River Basin Using BMA Multimodel Ensemble Technique[J]. Meteorological Monthly, 46(1): 108-118. DOI: 10.7519/j.issn.1000-0526.2020.01.011.
[复制英文]

资助项目

国家重点研发计划(2018YFC1508002和2018YFC1507200)、湖北省自然科学基金项目(2018CFB706)、湖北省气象局科技发展基金项目(2018Q02)及中国气象局武汉暴雨研究所基本科研业务费项目(IHRKYYW201815、IHRKYYW201909和IHRKYYW201911)共同资助

第一作者

祁海霞,主要从事数值模式和天气预报工作.Email:qxynl@163.com

通信作者

彭涛,主要从事水文气象预报研究.Email:pt_mail@sohu.com.

文章历史

2018年8月22日收稿
2019年11月5日收修定稿
清江流域降水的多模式BMA概率预报试验
祁海霞 1, 彭涛 1, 林春泽 1, 彭婷 2, 吉璐莹 2, 李兰 3, 孟翠丽 4    
1. 中国气象局武汉暴雨研究所暴雨监测预警湖北省重点实验室,武汉 430205
2. 南京信息工程大学气象灾害教育部重点实验室/气象灾害预报预警与评估协同创新中心,南京 210044
3. 武汉区域气候中心,武汉 430074
4. 武汉农业气象试验站,武汉 430040
摘要:基于TIGGE资料中的ECMWF、UKMO、JMA、CMA四套模式的2016年6月1至7月31日逐日降水集合预报资料,结合清江流域10个国家基准站观测数据,建立了流域贝叶斯模型平均(BMA)概率预报模型,开展流域多模式集合BMA技术的概率预报试验与评估。结果表明,在清江流域多模式集合的BMA模型最佳滑动训练期长度为40 d,BMA模型预报比原始集合预报有更高预报技巧,比四个原始集合预报MAE平均值减少近11%左右,而对于CRPS除了CMA中心无订正效果外,较其他三个模式平均值提高近15%左右。多模式集合BMA技术能预报降水全概率PDF曲线和大于某个降水量级的概率,同时能给出确定性降水预报,对于极端强降水(大暴雨—特大暴雨量级),BMA 75~90百分位数预报效果较好,对于强降水(暴雨量级),BMA 50~75百分位数预报效果较好,对于一般性降水(小雨—大雨量级),BMA确定性预报结果或50百分位数预报效果较好。
关键词TIGGE    贝叶斯模型平均(BMA)    多模式集合    概率预报    
Probabilistic Forecasting of Precipitation over the Qingjiang River Basin Using BMA Multimodel Ensemble Technique
QI Haixia1, PENG Tao1, LIN Chunze1, PENG Ting2, JI Luying2, LI Lan3, MENG Cuili4    
1. Hubei Key Laboratory for Heavy Rain Monitoring and Warning Research, Institute of Heavy Rain, CMA, Wuhan 430205;
2. Key Laboratory of Meteorological Disaster, Ministry of Education (KLME)/Collaborative Innovation Center on Forecast and Evaluation of Meteorological Disasters (CIC-FEMD), Nanjing University of Information Science and Technology, Nanjing 210044;
3. Wuhan Regional Climate Center, Wuhan 430074;
4. Wuhan National Agrometeorological Station, Wuhan 430040
Abstract: Based on the TIGGE datasets from the European Centre for Medium Range Weather Forecasts (ECMWF), the United Kingdom Met Office (UKMO), the China Meteorological Administration (CMA), and the Japan Meteorological Agency (JMA), and its multi-center ensemble systems, and observations in the Qingjiang River Basin, Bayesian model averaging (BMA) probability forecast models were established. The results showed that the optimal length of the training period is about 40 days, and the BMA models for multi-center ensemble outperform those for single center system for lead times of 24 h. The mean absolute error (MAE) and continuous ranked probability score (CRPS) skills of the BMA models are improved approximately 11% and 15%, respectively, compared with those of raw ensemble forecasts. In operation, when the BMA 90 percentile predicted precipitation is extreme precipitation [[50-100) mm·(24 h)-1], the 75-90 percentiles predicted precipitation could be used as the forecast reference, and the heavy precipitation warning could be carried out. For the forecast of severe precipitation [[50-100) mm·(24 h)-1], the forecast result of the 50-75 percentile predicted by BMA can be taken as a reference, while for the general precipitation [≤25 mm·(24 h)-1], the reference of BMA deterministic forecast is relatively strong. BMA probability forecast could give both the PDF curve with full probability and the probability greater than a certain precipitation intensity, which could provide the basis for the probability forecast in operation. However, the small probability value is often ignored, resulting in omission. So how to capture more useful information through the probabilistic prediction method and increase the accuracy of the prediction of extreme weather events will be a challenge for the probabilistic prediction technology.
Key words: TIGGE    Bayesian model averaging (BMA)    multimodel ensemble    probalility forecast    
引言

基于大气系统的非线性和复杂性,加上初值和模式等本身无法避免的一些不确定性,天气预报从单一的确定论向多值的概率论转变,不但符合气象科学的实际,也是更好地服务社会的需要,集合预报恰恰是这种转变的核心技术(Gneiting and Raftery, 2005; 杜钧和陈静, 2010; Zhi et al, 2012; 林春泽等, 2013; 汪叶和段晚锁, 2019)。

但是目前面对多模式多成员的情况下,若出现不同的预报方向该如何处理?模式后处理中的多模式概率预报将是很好的解决办法。早期常运用线性回归法或逻辑回归法对多模式多成员结果给出超过某个阈值的特定事件发生概率(Bermowitz, 1975; Hamill et al, 2004),但这些概率预报方法不能给出全部预报的概率密度函数(PDF)。Roberts(1965)提出用一个分布函数将两种不同的意见或模式相结合,随后Leamer (1978)将上述想法加以拓展并阐述了贝叶斯模型平均(Bayesian model averaging,BMA)的基本框架。接着国内外学者不断尝试将BMA方法应用到单模式的集合预报系统中,随后又将其扩展应用到多模式集合系统中。Rajagopalan et al (2002)提出贝叶斯方案的权重由多模式集合的最大对数似然函数确定。Barnston et al (2003)将这种方法作了变化,并且应用于季节气候预测,发挥了重要作用。

目前BMA模型主要应用于天气尺度、气候尺度及水文集合预报中,研究表明,BMA预报效果明显优于原始集合预报,提高了概率预报准确率,具有重要应用价值(Wilson et al, 2007; Sloughter et al, 2007; 2010;Liu and Xie, 2014; Wang et al, 2013; Erickson et al, 2012; Kim et al, 2017; Zhi and Ji, 2018; Zhang et al, 2019; Ji et al, 2019; 杨瑞雯等, 2017)。Raftery et al (2005)Wilson et al (2007)利用BMA方法对正态分布的地面温度和海平面气压进行定量化预报;Sloughter et al (20072010)将BMA方法对偏态分布的降水和风速进行定量概率预报。Fraley et al (2010)Liu and Xie(2014)将BMA方法拓展用于实践中常出现的有缺省或者可替换的集合成员情况。上述研究结果均指出多模式集成BMA方法的结果要优于任何单一的、未处理的或者单个集合系统的BMA后处理结果。

近几年中国学者也尝试将贝叶斯决策理论应用到气象研究中。智协飞等(2014b)评述了对多模式集成的概率天气预报和气候预测研究进展,着重讨论了多模式集成的概率预报贝叶斯模型平均和多元高斯集合核拟合法,指出利用BMA方法制作的概率预报的方差较小,减小了预报的不确定性,预报结果更接近大气的真实值。在天气要素预报方面,陈朝平等(2010)利用四川暴雨的气候概率对集合降水概率预报产品进行了修正,对四川暴雨预报准确率有所提高。赵琳娜等(2010)利用BMA方法对淮河流域的降水对T213集合预报成员的定量降水预报进行了集成与订正,表明经过BMA模型订正后的结果比确定性预报更强。张宇彤等(2016)采用百分位法对观测极端降水的阈值进行定义,根据贝叶斯理论探讨了极端降水的概率预报方法,结果表明,经过贝叶斯方法修订后的极端降水预报,提高了极端降水产生的正确率,但是空报也有所增加。智协飞等(2014a)利用2008年1月TIGGE资料中的CMA、NCEP和ECMWF三套模式的温度集合预报产品,进行多模式集合的贝叶斯概率预报试验。刘建国等(2013)利用TIGGE多中心集合预报系统资料对淮河流域24 h地面日均气温建立BMA概率预报模型并进行概率预报,结果表明多中心超级集合比单中心BMA概率预报效果好,采用可替换原则的多中心超级集合BMA概率预报效果最好。吉璐莹等(2017)利用多模式资料对东亚地区冬季地面2 m气温10~15 d延伸期集合预报产品,建立BMA概率预报模型,结果认为BMA预报为气温的延伸期概率预报供了更合理的概率分布,定量描述了预报的不确定性。在气候预测方面,智协飞等(2015)胡航菲等(2016)郯俊岭等(2016)利用CMIP5的多个全球气候系统模式分别对东亚气温、东亚夏季500 hPa位势高度场以及中国气温的回报结果进行BMA试验, 结果均表明, BMA的回报效果最好,优于单模式以及集合平均回报效果。BMA方法在洪水预报方面研究的不多,梁莉等(2013)利用T213模式的24~72 h集合预报, 对T213模式15个集合成员预报的降水进行了BMA概率集成与偏差订正, 并将订正后的降水预报输入VIC(variable infiltration capacity)水文模型中进行水文概率预报,指出经BMA订正后的24~72 h降水预报精度较订正前有所提高,BMA模型给出的有效区间(25百分位数至75百分位数)预报将实况降水量包含在内的可能性比订正前更大,经BMA订正的降水集合预报, 由VIC水文模型模拟得到的径流量变化趋势与实况较吻合。

目前国内缺乏针对洪水灾害频发的长江流域多模式集合BMA模型预报参数的率定、评估及概率预报潜力的研究。清江流域属于长江流域上游,水文气象特点复杂,极端事件频发,是水文气象研究的典型流域。2016年梅雨期受超强厄尔尼诺事件影响,7月18—20日,清江流域遭遇了百年一遇的大洪水。流域上游水布垭水库出现建库以来的最大洪峰,并进行2008年以来首次开闸泄洪。本文将以清江流域这次典型大洪水的强降水过程为研究对象,利用TIGGE资料中四套模式,即欧洲中期天气预报中心(ECMWF)、英国气象局(UKMO)、日本气象厅(JMA)和中国气象局(CMA)的降水集合预报资料(详见表 1),结合流域内站点观测资料,通过率定BMA模型参数,建立针对清江流域的多模式集合BMA概率预报模型,并对集合后的预报效果进行检验评估,探讨多模式集合的BMA确定性预报以及概率预报结果在此流域的适应性以及参考价值。

1 贝叶斯模型平均(BMA) 1.1 多模式集合降水预报的BMA模型

贝叶斯模型平均(BMA)是一种结合多个统计模型进行联合推断和预测并可以产生高度集中的概率密度函数(PDF)的统计后处理方法。Raftery et al(2005)将其应用到多个动力模型中。令f=f1, …, fK分别表示K个不同数值模式预报结果,y为需要预报的变量,yT为训练期数据。依据BMA原理,预报量y在训练数据yT下基于K个不同模式下的预测PDF为:

$ p\left(y | f_{1}, \cdots, f_{K}\right)=\sum\limits_{k=1}^{K} w_{k} g_{k}\left[y |\left(f_{k}, y^{T}\right)\right] $ (1)

式中:gk[y|(fk, yT)]可理解为预报变量y在模型训练期阶段yT,模式fk预报为最佳预报条件下的概率密度函数,表征fk在训练期为最优预报的可能性;wk为各个集合模式在训练期为最佳预报的后验概率也可称之为权重,非负且$ \sum\limits_{k=1}^{K} w_{k}=1$=1,反映的是每个数值模式在模型训练期对预报技巧的相对贡献程度。由于降水作为一个不连续的变量,呈现偏态分布,进行BMA试验时不能像温度等物理量采用简单的正态假设。因此本文采用符合降水偏态分布的Gamma分布函数进行拟合(Hamill et al,2004),且对降水的研究分为以下两种情况。

第一,考虑无降水发生概率(PoP)。本文采用Hamill et al(2004)提出的以预报值fk的变形为预报变量的逻辑回归模型,原文中将fk变形成fk1/4Sloughter et al(2007)认为在其他条件同等的情况下,变形的fk1/3预报效果较fk1/4更好,因此本文采用fk1/3作为预报变量。最后对于无降水概率部分采取逻辑回归模型,计算式如下:

$ \begin{aligned} \operatorname{logit}[P(y&\left.\left.=0 | f_{k}\right)\right] \equiv \log \frac{P\left(y=0 | f_{k}\right)}{P\left(y>0 | f_{k}\right)} \\ &=a_{0 k}+a_{1 k} f_{k}^{\frac{1}{3}}+a_{2 k} \delta_{k} \end{aligned} $ (2)

式中:当预报值fk≠0时,δk=0;fk=0时,δk=1。参数a0k, a1k, a2k通过二元逻辑回归方法拟合各个集合模式预报值和相应观测值所确定。

第二,考虑降水量大于0的概率密度函数。这里采用Gamma分布函数进行拟合,其相应的概率密度函数拟合降水量可表述为:

$ g_{k}\left(y | f_{k}\right)=\frac{1}{\beta_{k}^{\alpha} \varGamma\left(\alpha_{k}\right)} y^{\alpha_{k}-1} \exp \left(-y / \beta_{k}\right) $ (3)
$ \begin{aligned} &\mu_{k}=\alpha_{k} \beta_{k}=b_{0 k}+b_{1 k} f_{k}^{1 / 3}\\ &\sigma_{k}^{2}=\alpha_{k} \beta_{k}^{2}=c_{0}+c_{1} f_{k} \end{aligned} $ (4)

式中:y可以认为是预报对应的实况降水值;Г(·)是指Gamma函数;αk, βk分别为形状和尺度参数;μkσk分别为各个集合模式的Gamma概率密度函数的均值和方差;参数b0kb1k计算方法采取线性回归方法,以实况降水的立方根作为因变量,而各个集合模式预报量的立方根为预报变量,估计出参数b0kb1k的值。

至于参数wkc0c1的估算则采用期望最大化(EM)算法。BMA模式的似然函数形式如下:

$ l\left(w_{1}, \cdots, w_{k} ; c_{0}, c_{1}\right)=\sum\limits_{t} \log p\left(y_{s t} | f_{1 s t}, \cdots f_{K s t}\right) $ (5)

式中:p(ys t|f1st, …, fKst)由式(1)求得;yst为训练期内的降水观测值;fKst为训练期内的各集合模式的预报值;s, t分别表示相应的格点和时间。

EM算法是用于存在未知变量的情况下查找最大似然因子的算法。为便于计算,引入未知变量zkst,其取值规则:当第k个成员是最佳预报结果时,其值为1;若第k个成员的预报结果不是最佳预报结果时,其值为0。在实际计算过程中zkst的值并不一定是整数。EM算法是一个两步迭代算法。待估参数会首先给定一个合理的初值估计,然后再进行迭代。迭代分为两步进行:

第一步,$ \hat{z}_{k s t}^{j+1}=\frac{w_{k}^{j} p\left(y_{s t} | f_{k s t}\right)}{\sum\limits_{l=1}^{K} w_{1}^{j} p\left(y_{s t} | f_{1 s t}\right)}$,其中上标j表示第j次迭代,p(yst|fkst)可根据式(1)求得,$ \hat{{z}}_{k s t}^{j+1}$是变量zkst在第j次迭代过程的估计值。第二步,$ w_{k}^{j+1}=\frac{1}{n} \sum\limits_{i} \hat{z}_{k r t}^{j+1}$,式中n是各个格点的训练期内的发生降水的次数。而参数c0c1没有解析解,只能根据目前的权重估计值求似然函数的最大值求得。

至此,各集合预报成员fk对应的概率密度函数可表示为:

$ \begin{array}{c} h_{k}\left(y | f_{k}\right)= P\left(y=0 | f_{k}\right) I(y=0)+\\ P\left(y>0 | f_{k}\right) g_{k}\left(y | f_{k}\right) I(y>0) \end{array} $ (6)

式中:I为指示函数,当y=0时,I(y=0)为1,I(y>0)为0;当y>0时,I(y=0)为0,I(y>0)为1。

综上所述,按照式(1)将所有集合成员的概率密度函数按照各自的后验概率或权重累加,就得出多成员集合降水的BMA概率密度函数(PDF),具体表达式为:

$ p\left(y | f_{1}, \cdots, f_{K}\right) =\sum\limits_{k=1}^{K} w_{k}\left[P\left(y=0 | f_{k}\right) \times\right.\\ I(y=0)+P\left(y>0 | f_{k}\right) g_{k}\left(y | f_{k}\right) \times \\ I(y>0)] $ (7)

其中,P(y=0|fk)及P(y>0|fk)的关系见式(2),gk(y|fk)的具体表达式见式(3)。

本文采用滑动训练期预报方式,即训练期是一个滑动窗口,BMA模型采用最靠近预报日之前的N天作为训练期进行训练,训练出的BMA参数应用到下一天(24 h预报)的BMA模型预报中,每一天动态建立研究区域内各站点的BMA模型。

1.2 BMA概率预报检验与评估方法

本文选取平均绝对误差(MAE)以及连续等级概率评分(CRPS)指标来检验BMA定量降水预报以及概率降水预报结果。MAE是反映预报误差的指标,其计算方法为:

$ M A E=\frac{1}{N} \sum\limits_{i=1}^{N}\left|f_{i}-o_{i}\right| $ (8)

式中,oi是观测值,fi是BMA确定性预报结果(这里定义BMA概率密度函数最大值对应的降水量为确定性预报结果),N是所有站点以及时间总数。

CRPS评分可看作是阈值连续化之后BS评分(Brier,1950)在所有可能阈值上的积分。设Fi(x)为预报累积概率分布函数(CDF),x是降水预报值,oi是降水观测值,CRPS可表示为:

$ C R P S=\frac{1}{N} \sum\limits_{i=1}^{N} \int_{-\infty}^{+\infty}\left[F_{i}(x)-H\left(x-o_{i}\right)\right] \mathrm{d} x $ (9)

式中,H(x-oi)为Heaviside函数。x < oiH(x-oi)=0,否则,H(x-oi)=1。

2 研究区域与资料

本研究取清江流域作为研究区域(图 1)。清江是长江的一级支流,全长为423 km,流域控制面积为1.67万km2。流域内水文气象特点复杂,极端天气事件频发;分布有水布垭、隔河岩和高坝州三个梯级水库。

图 1 清江流域及10个国家基准气象观测站(黑点)分布 Fig. 1 Distribution of the Qingjiang River Basin and the location (dots) of 10 standard meteorological stations

观测资料为该区域内10个国家基准气象站2016年6月1日至7月31日20—20时逐日降水观测数据。数值模式结果为同时期TIGGE全球集合预报系统中ECMWF、UKMO、CMA、JMA四套多模式多成员的24 h预报时效逐日降水集合预报资料(起报时间为世界时12时)。各集合预报系统有关信息见表 1。根据各模式输出的集合预报结果,对各模式多成员结果进行平均,使用双线性插值方法获得流域内各站点的集合预报结果,并将7月11—19日作为BMA预报的固定预报期。

表 1 TIGGE四个全球集合预报系统(ECMWF,NCEP,UKMO,CMA)基本信息 Table 1 Description of four ensemble prediction systems in TIGGE in this study (ECMWF, UKMO, CMA, JMA)
3 结果

对于BMA概率预报,首先给出适合清江流域的BMA模型预报训练期长度,再给出预报期内各个集合模式的权重,并对多站点多时间平均的模型性能进行检验评估,最后给出这次强降水过程两个典型站点某一天的BMA预报PDF。

3.1 训练期长度选取

由于天气系统和集合预报系统的性能在不同区域、不同季节会有所变化,这里主要针对清江流域汛期,以各模式训练期内集合预报和观测降水量作为训练数据来率定模型参数,建立BMA概率预报模型,并将训练好的参数以及各模式下一天降水集合预报数据,代入模型进行预报。通过MAE和距平相关系数(ACC)两种指标检验BMA模型性能。两种指标都是值越小模型性能越好。考虑到多日连续无降水情况影响训练结果,训练期长度选取最少20 d以上,并以7月18—19日作为验证期。BMA模型的各项检验指标取验证期期间所有站点的均值。图 2给出多模式集合的BMA模型预报的MAE、ACC随训练期长度的变化。由图看出:训练期长度在40 d前,随着天数增加,MAE有减小趋势,40 d后,MAE趋于平稳;从ACC评分来看,训练期长度引起的ACC值变幅不大。综合两个检验指标,文中选取40 d作为最优滑动训练期长度。

图 2 多模式集合的BMA模型预报的MAE(a)、ACC(b)随训练期长度的变化 Fig. 2 Comparison of BMA predictive models of average daily precipitation (a) MAE, (b) ACC for different training period lengths
3.2 各集合模式权重对比

以24 h预报为例,图 3是2016年7月11—19日预报期内各集合模式的权重对比。由图可见,四个集合模式的权重相差还是比较大的,其中CMA整个预报期的权重最小,而在发生强降水的18、19日两天,各模式权重进行了调整,CMA及UKM权重开始增大,说明滑动训练期内两模式预报贡献越来越大,权重也相应得到了变化,这也是滑动训练期较固定训练期的一个优点。

图 3 2016年7月11—19日预报期内各集合模式的权重对比 Fig. 3 BMA weights of the four models over the prediction period for precipitation during 11-19 July 2016
3.3 BMA概率预报检验与评估

图 4给出清江流域所有站点及预报期多模式集合BMA模型预报及原始单模式集合预报的MAE和CRPS检验指标均值对比。由图看出,多模式集合的BMA模型预报的MAE较所有单模式以及集合平均预报有更好的预报效果。对于CRPS评分结果,BMA与CMA模式预报效果相当,但高于其他三个集合模式。综合MAE和CRPS评分,多模式集合的BMA预报对单模式预报结果有很好的订正效果,比四个原始集合预报MAE平均值减少近11%左右,而对于CRPS,除了CMA模式无订正效果外,较其他三个模式平均值提高近15%左右。

图 4 所有站点的多模式集合BMA预报及原始单模式集合预报的MAE(a)、CRPS(b)均值对比 Fig. 4 Comparison of MAE means (a) and CRPS means (b) of BMA predictive models and four models ensemble forecasts of daily precipitation
3.4 BMA概率预报分析

选取清江流域这次大洪水过程中2016年7月18日发生极端强降水的建始站(Jianshi,站号57445)及2016年7月17日发生一般性降水的利川站(Lichuan,站号57439)作为典型站点分析多模式集合的BMA概率预报相关结果。表 2给出了建始站以及利川站BMA模型预报的四个集合模式的权重(BMA weight)、各集合模式预报的无降水概率(member POP)、BMA预报的无降水概率(BMA POP)、各集合模式预报降水量(member forecast)、BMA确定性预报降水量(BMA forecast)、BMA概率预报的50百分位[BMA forecast(50P)]和90百分位预报降水[BMA forecast(90P)]以及实况降水量(observation)。由表 2看出,对于7月18日建始站,四个集合模式中有三个(ECMWF、UKMO、JMA)预报降水均在50 mm即暴雨量级以下,CMA预报结果相对较好,而多模式集合的BMA确定性以及百分位预报结果将降水量级提高到了暴雨量级,较单模式预报效果要好。相较于实况(218 mm),BMA降水预报结果仍存在偏小的问题,但BMA概率预报的90百分位预报可很好地将其包含在内。这也说明对于极端降水而言,可将75~90较大百分位点预报降水作为预报参考,概率降水预报相对定量降水预报能更好地描述降水的实际情况,减少漏报误差,具有一定的优势。表 2还给出一般性降水的利川站BMA预报个例,可以看出,BMA确定性预报较其他集合模式预报与实况更加接近,BMA概率预报的百分位数值能将降水实况包含在内,但是90百分位预报降水明显偏大,这也说明BMA概率预报的范围往往比较宽大,即使是概率预报也是存在不确定性的,那么如何能缩小这种不确定性,给出大气最可能发生的状态,将是概率预报的一个挑战。

表 2 2016年7月18日建始站以及7月17日利川站BMA模型预报的效果评估 Table 2 BMA probabilistic quantitative forecasts, four models ensemble forecasts, logistic regression PoP, percentile forecasts and observations at Jianshi Station on 18 and Lichuan Station on 17 July 2016

BMA概率预报可以产生高度集中的概率密度函数PDF曲线。PDF曲线越尖,区间范围越窄,说明BMA预报可以将实际大气可能发生状态缩小在一个更小的区间范围内,预报的不确定性也更小。图 5给出7月18日建始站及17日利川站24 h预报时效BMA预报降水的PDF。BMA预报的PDF(黑色曲线)是四个集合模式PDF(蓝色曲线)的加权结果。由图 5a看出,对于极端降水事件(大暴雨量级以上),实况降水(黑色垂直线)远远超出了四个集合模式(黑色空心圈)的预报结果,但是BMA预报的PDF曲线却能很好地将其包含在内,没出现漏报现象,但是结果接近90百分位预报。而对于一般性降水(大雨量级以下,图 5b),经过BMA集合后的PDF曲线较三个集合模式曲线更尖更窄,缩小了预报结果的不确定性。其中一个模式预报的PDF曲线区间范围较BMA预报要小,但是从确定性预报结果看,BMA确定性预报与实况最为接近。

图 5 2016年7月18日建始站(a)和17日利川站(b)24 h预报时效24 h累积降水BMA预报PDF曲线 (黑色曲线:BMA预报PDF,蓝色曲线:四个集合模式预报PDF,黑色垂直实线:实况,黑色空心圈:四个集合成员预报,红色垂直实线:BMA的50百分位预报,粉色垂直虚线:BMA的10和90百分位预报) Fig. 5 BMA predictive PDF of daily precipitation at (a) Jianshi Station on 18 and (b) Lichuan Station on 17 July 2016 (black solid curve: BMA predictive PDF; blue solid curve: four models' predictive PDF; black thick vertical line: observation; red vertical line: deterministic forecast; dashed pink vertical lines: the 10th percentile and 90th percentile forecasts from the BMA predictive PDF)

由以上分析表明,采用BMA法产生的PDF能缩小预报的不确定性,可以通过分析其全概率结果利用百分位预报数据,对其不确定性给出定量的预估。对于极端强降水预报,参考75~90较大百分位数预报结果更合理,而对于一般性降水预报,BMA确定性预报结果或50百分位数预报结果的参考性比较强。

3.5 百分位预报法及极端降水分析

BMA概率预报给出的是全概率PDF结果,其包含了集合预报不确定性的定量估计。刘建国等(2013)通过BMA概率预报方法分析了高温极端天气事件信息,并提出基于集合预报的概率分布来预警高温天气的方案。本文根据BMA预报PDF给出百分位预报结果,研究分析多模式集合的BMA百分位预报法在极端事件或一般性事件中的适用性,探讨如何捕捉PDF中有用信息,并探讨其局限性。

图 6给出了2016年7月17日、18日清江流域10个站24 h预报时效逐日降水的BMA百分位预报和观测。其中7月17日流域内各站实况降水均在50 mm以下,对于这种一般性降水,BMA确定性预报结果能较好地预报出当日降水量(图 6a),也说明BMA不仅可以进行概率预报,其确定性预报结果也是比较可靠的,可以作为定量预报的参考依据。但是对于强降水或极端强降水事件来说,BMA确定性预报结果往往偏弱,尤其对于100 mm以上极端强降水,BMA确定性预报几乎没有预报能力(图 6b),这也是确定性预报的缺陷,因此需要通过概率预报进行强降水信息的补充。恩施、利川、五峰、建始四个100 mm以上极端强降水站点,BMA预报的50~90百分位点降水量能将实况比较好地包含进去。对于建始站,BMA的90百分位预报才能给出比较好的预报结果,因此可将较大的75~90百分位预报降水作为预报参考。而对于暴雨量级的一般性强降水而言,BMA预报的50~75百分位预报效果较好。

图 6 2016年7月17日(a)、18日(b)清江流域10个站24 h预报时效降水的BMA百分位预报和观测 (P10、P50、P75、P90曲线分别为经过PDF计算得到的10、50、75以及90百分位数预报值,BMA曲线为确定性预报结果) Fig. 6 Percentile forecasts (P10, P50, P75, P90) and observations of average precipitation at all stations in Qingjiang River Basin on 17 (a) and 18 (b) July 2016

对比图 6a6b,还可看出,同是BMA 90百分位预报的24 h降水量,一般性降水量预报在100 mm附近,但是对于强降水事件,90百分位预报的降水量达200 mm左右,这也是BMA概率预报为可能发生强降水提供的一个信息。当出现这种信息时,决策者就要考虑出现强降水或极端降水事件的可能性,尽可能将75~90百分位预报结果作为预测参考依据,并进行强降水预警,同时采取应对强降水的措施。

在降水预报中我们往往还想看到强降水发生的概率大小,BMA预报既能给出全概率的PDF曲线也能给出小于某个降水量级以下的累积概率(CDF)分布,通过1减去CDF则可以得到大于某个降水量级的概率。图 7给出了2016年7月18日清江流域10个站24 h预报时效日降水预报超过50、100、150和200 mm的概率与观测。分析图 7看出,预报的降水概率与实况观测有一定的一致性。对于当日强降水预报,各站预报50mm以上的降水概率值均超过了0.8,属于高概率预报,而实况除了枝江站其他各站雨量均超过了50 mm。对于实况超过100 mm以上的四个站,概率预报值也达到了0.6左右,BMA概率预报对这次暴雨事件预报效果较好,从另一个角度也说明根据概率预报进行强降水预警的可行性。但是其也有局限性,存在空报、漏报等预报不准的风险。图 7中宣恩、咸丰两站实况为58和64 mm,但是预报超过100 mm的概率值超过了0.6,属于空报。而对于建始站的218 mm极端强降水,大于200 mm的概率值虽然有一定的体现,但是值较小,容易被漏报。因此,如何从各数值模式预报基础上,通过多模式集合的概率预报方法中捕捉到更多有用信息并使极端天气事件发生的可能性更加突出,以减少空报、漏报,增加概率预报对极端天气事件预报的准确度,这将是对概率预报技术的挑战也是概率预报需要考虑的方向。

图 7 2016年7月18日清江流域10个站24 h预报时效日降水BMA预报超过50、100、150以及200 mm的概率与观测 Fig. 7 Probability of exceeding 50 mm and observations for 24 h precipitation at all 10 stations Qingjiang River Basin on 18 July 2016
4 结论与讨论

本文尝试将多模式集合贝叶斯模型平均技术(BMA)应用于清江流域2016年引发大洪水的强降水事件中,针对24 h预报时效逐日降水建立多模式集合BMA概率预报模型,对比检验了BMA技术的确定性预报和概率预报及原始集合预报结果,并对极端强降水(大暴雨—特大暴雨量级)、强降水(暴雨量级)与一般性降水(小雨—大雨量级)等典型个例进行预报分析,得到以下主要结论:

(1) 在清江流域开展TIGGE多模式集合的BMA概率降水预报试验,通过多组训练期长度敏感性试验分析表明,训练期长度选择40 d较为合适。

(2) 多模式集合BMA预报比原始集合预报有更高预报技巧,比四个原始集合预报MAE平均值减少近11%左右,而对于CRPS除了CMA模式无订正效果外,较其他三个模式平均值提高近15%左右。

(3) BMA预报既能给出确定性预报结果也可以给出概率预报结果。对于极端强降水,BMA的75~90百分位数预报效果较好,对于强降水,BMA的50~75百分位数预报效果较好,对于一般性降水,BMA确定性预报结果或50百分位数预报效果较好。

概率预报是气象预报发展的趋势,贝叶斯原理在概率预报研究和业务中均有较好应用潜力,但也有其局限性。对实况观测以及模式预报结果依赖性较强,导致训练期长度在不同区域适应性差;对于集合成员后验概率或权重的率定,需要多次试验,以获得更优的预报效果;BMA概率预报虽然能给出全概率的PDF曲线,但是也会出现空报或漏报现象。本文仅针对清江流域一次引发洪水过程的典型降水进行BMA概率预报试验,下一步拟开展多模式集合BMA技术在流域水文洪水预报中的应用。

参考文献
陈朝平, 冯汉中, 陈静, 2010. 基于贝叶斯方法的四川暴雨集合概率预报产品释用[J]. 气象, 36(5): 32-39. Chen C P, Feng H Z, Chen J, 2010. Application of Sichuan heavy rainfall ensemble prediction probability products based on Bayesian method[J]. Meteor Mon, 36(5): 32-39 (in Chinese). DOI:10.3969/j.issn.1003-6598.2010.05.012
杜钧, 陈静, 2010. 单一值预报向概率预报转变的基础:谈谈集合预报及其带来的变革[J]. 气象, 36(11): 1-11. Du J, Chen J, 2010. The corner stone in facilitating the transition from deterministic to probabilistic forecasts-ensemble forecasting and its impact on numerical weather prediction[J]. Meteor Mon, 36(11): 1-11 (in Chinese). DOI:10.7519/j.issn.1000-0526.2010.11.001
胡航菲, 智协飞, 郭换换, 等, 2016. 基于CMIP5资料的东亚夏季环流的BMA预测研究[J]. 气象科学, 36(3): 340-348. Hu H F, Zhi X F, Guo H H, et al, 2016. Bayesian model averaging prediction of summer circulation over East Asia based on CMIP5 data[J]. J Meteor Sci, 36(3): 340-348 (in Chinese).
吉璐莹, 智协飞, 朱寿鹏, 2017. 东亚地区冬季地面气温延伸期概率预报研究[J]. 大气科学学报, 40(3): 346-355. Ji L Y, Zhi X F, Zhu S P, 2017. Extended-range probabilistic forecasts of surface air temperature over East Asia during boreal winter[J]. Trans Atmos Sci, 40(3): 346-355 (in Chinese).
梁莉, 赵琳娜, 齐丹, 等, 2013. 基于贝叶斯原理降水订正的水文概率预报试验[J]. 应用气象学报, 24(4): 416-424. Liang L, Zhao L N, Qi D, et al, 2013. The experiment of hydrologic probabilistic forecast based on the precipitation forecast calibrated by Baye-sian model averaging[J]. J Appl Atmos Sci, 24(4): 416-424 (in Chinese). DOI:10.3969/j.issn.1001-7313.2013.04.004
林春泽, 祁海霞, 智协飞, 等, 2013. 中国夏季降水多模式集成概率预报研究[J]. 暴雨灾害, 32(4): 354-359. Lin C Z, Qi H X, Zhi X F, et al, 2013. Study on multi-model ensemble probability forecast for summer precipitation in China[J]. Torrent Rain Dis, 32(4): 354-359 (in Chinese). DOI:10.3969/j.issn.1004-9045.2013.04.008
刘建国, 谢正辉, 赵琳娜, 等, 2013. 基于TIGGE多模式集合的24小时气温BMA概率预报[J]. 大气科学, 37(1): 43-53. Liu J G, Xie Z H, Zhao L N, et al, 2013. BMA probabilistic forecasting for the 24-h TIGGE multi-model ensemble forecasts of surface air temperature[J]. Chin J Atmos Sci, 37(1): 43-53 (in Chinese).
郯俊岭, 江志红, 马婷婷, 2016. 基于贝叶斯模型的中国未来气温变化预估及不确定性分析[J]. 气象学报, 74(4): 583-597. Tan J L, Jiang Z H, Ma T T, 2016. Projections of future surface air temperature change and uncertainty over China based on the Bayesian model averaging[J]. Acta Meteor Sin, 74(4): 583-597 (in Chinese).
汪叶, 段晚锁, 2019. 初始扰动振幅和集合样本数对CNOPs集合预报的影响[J]. 大气科学, 43(4): 915-929. Wang Y, Duan W S, 2019. Influences of initial perturbation amplitudes and ensemble sizes on the ensemble forecasts made by CNOPs[J]. Chin J Atmos Sci, 43(4): 915-929 (in Chinese).
杨瑞雯, 赵琳娜, 巩远发, 等, 2017. 中国东南地区降水的两种集合预报综合偏差订正对比分析[J]. 暴雨灾害, 36(6): 507-517. Yang R W, Zhao L N, Gong Y F, et al, 2017. Comparative analysis of integrated bias correction to ensemble forecast of precipitation in southeast China[J]. Torr Rain Dis, 36(6): 507-517 (in Chinese). DOI:10.3969/j.issn.1004-9045.2017.06.003
张宇彤, 矫梅燕, 陈静, 等, 2016. 基于贝叶斯方法的极端降水概率预报试验[J]. 气象, 42(7): 799-808. Zhang Y T, Jiao M Y, Chen J, et al, 2016. Probabilistic forecasting of extreme precipitation experiment based on Bayesian theory[J]. Meteor Mon, 42(7): 799-808 (in Chinese).
赵琳娜, 吴昊, 田付友, 等, 2010. 基于TIGGE资料的流域概率性降水预报评估[J]. 气象, 36(7): 133-142. Zhao L N, Wu H, Tian F Y, et al, 2010. Assessment of probabilistic precipitation forecasts for the Huaihe Basin using TIGGE data[J]. Meteor Mon, 36(7): 133-142 (in Chinese).
智协飞, 李刚, 彭婷, 2014a. 基于贝叶斯理论的单站地面气温的概率预报研究[J]. 大气科学学报, 37(6): 740-748. Zhi X F, Li G, Peng T, 2014a. On the probabilistic forecast of 2 meter temperature of a single station based on Bayesian theory[J]. Trans Atmos Sci, 37(6): 740-748 (in Chinese).
智协飞, 彭婷, 李刚, 等, 2014b. 多模式集成的概率天气预报和气候预测研究进展[J]. 大气科学学报, 37(2): 248-256. Zhi X F, Peng T, Li G, et al, 2014b. Advances in multimodel ensemble probabilistic prediction[J]. Trans Atmos Sci, 37(2): 248-256 (in Chinese).
智协飞, 王晶, 林春泽, 等, 2015. CMIP5多模式资料中气温的BMA预测方法研究[J]. 气象科学, 35(4): 405-412. Zhi X F, Wang J, Lin C Z, et al, 2015. Bayesian model average prediction on temperature by CMIP5 data[J]. J Meteor Sci, 35(4): 405-412 (in Chinese).
Barnston A G, Mason S J, Goddard L, et al, 2003. Multimodel ensembling in seasonal climate forecasting at IRI[J]. Bull Amer Meteor Soc, 84(12): 1783-1796. DOI:10.1175/BAMS-84-12-1783
Bermowitz R J, 1975. An application of model output statistics to forecasting quantitative precipitation[J]. Mon Wea Rev, 103(2): 149-153. DOI:10.1175/1520-0493(1975)103<0149:AAOMOS>2.0.CO;2
Brier G W, 1950. Verification of forecasts expressed in terms of pro-bability[J]. Mon Wea Rev, 78(1): 1-3. DOI:10.1175/1520-0493(1950)078<0001:VOFEIT>2.0.CO;2
Erickson M J, Colle B A, Charney J J, 2012. Impact of bias-correction type and conditional training on Bayesian model averaging over the northeast United States[J]. Wea Forecasting, 27(6): 1449-1469. DOI:10.1175/WAF-D-11-00149.1
Gneiting T, Raftery A E, 2005. Atmospheric science:weather forecasting with ensemble methods[J]. Science, 310(5746): 248-249. DOI:10.1126/science.1115255
Fraley C, Raftery A E, Gneiting T, 2010. Calibrating multimodel forecasting ensembles with exchangeable and missing members using Bayesian model averaging[J]. Mon Wea Rev, 138(1): 190-202. DOI:10.1175/2009MWR3046.1
Hamill T M, Whitaker J S, Wei X, 2004. Ensemble reforecasting:improving medium-range forecast skill using retrospective forecasts[J]. Mon Wea Rev, 132(6): 1434-1447. DOI:10.1175/1520-0493(2004)132<1434:ERIMFS>2.0.CO;2
Ji L Y, Zhi X F, Zhu S P, et al, 2019. Probabilistic precipitation forecasting over East Asia using Bayesian model averaging[J]. Wea Forecasting, 34(2): 377-392. DOI:10.1175/WAF-D-18-0093.1
Kim Y, Kim W, Ohn I, et al, 2017. Leave-one-out Bayesian model ave-raging for probabilistic ensemble forecasting[J]. Commun Stat Appl Methods, 24(1): 67-80.
Leamer E E, 1978. Specification Searches[M]. New York: John Wiley and Sons.
Liu J G, Xie Z H, 2014. BMA probabilistic quantitative precipitation forecasting over the Huaihe Basin using tigge multimodel ensemble forecasts[J]. Mon Wea Rev, 142(4): 1542-1555. DOI:10.1175/MWR-D-13-00031.1
Raftery A E, Gneiting T, Balabdaoui F, et al, 2005. Using Bayesian model averaging to calibrate forecast ensembles[J]. Mon Wea Rev, 133(5): 1155-1174. DOI:10.1175/MWR2906.1
Rajagopalan B, Lall U, Zebiak S E, 2002. Categorical climate forecasts through regularization and optimal combination of multiple GCM ensembles[J]. Mon Wea Rev, 130(7): 1792-1811. DOI:10.1175/1520-0493(2002)130<1792:CCFTRA>2.0.CO;2
Roberts H V, 1965. Probabilistic prediction[J]. J Amer Stat Assoc, 60(309): 50-62. DOI:10.1080/01621459.1965.10480774
Sloughter J M, Raftery A E, Gneiting T, et al, 2007. Probabilistic quantitative precipitation forecasting using Bayesian model ave-raging[J]. Mon Wea Rev, 135(9): 3209-3220. DOI:10.1175/MWR3441.1
Sloughter J M, Gneiting T, Raftery A E, 2010. Probabilistic wind speed forecasting using ensembles and Bayesian model averaging[J]. J Amer Stat Assoc, 105(489): 25-35. DOI:10.1198/jasa.2009.ap08615
Wang Q J, Schepen A, Robertson D E, 2013. Merging seasonal rainfall forecasts from multiple statistical models through Bayesian model averaging[J]. J Climate, 25(16): 5524-5537.
Wilson L J, Beauregard S, Raftery A E, Verret R, 2007. Calibrated surface temperature forecasts from the Canadian ensemble prediction system using Bayesian model averaging[J]. Mon Wea Rev, 135(4): 1364-1385. DOI:10.1175/MWR3347.1
Zhang H P, Chu P S, He L K, et al, 2019. Improving the CPC's ENSO forecasts using Bayesian model averaging[J]. Climate Dyn, 53(5-6): 3373-3385. DOI:10.1007/s00382-019-04710-7
Zhi X F, Ji L Y, 2018. BMA probabilistic forecasting of the 500hPa geopotential height over northern Hemisphere using TIGGE multimodel ensemble forecasts[J]. AIP Conf Proc, 1982(1): 020019. DOI:10.1063/1.5045425
Zhi X F, Qi H X, Bai Y Q, et al, 2012. A comparison of three kinds of multimodel ensemble forecast techniques based on the TIGGE data[J]. Acta Meteor Sin, 26(1): 41-51.