基于贝叶斯理论的集合降水概率预报方法研究

论文

引用本文 [复制中英文]

韩焱红, 矫梅燕, 陈静, 等, 2013. 基于贝叶斯理论的集合降水概率预报方法研究[J]. 气象, 39(1): 1-10. DOI: 10.7519/j.issn.1000-0526.2013.01.001.

HAN Yanhong, JIAO Meiyan, CHEN Jing, et al, 2013. Study on the Method of Rainfall Ensemble Probability Forecast Based on Bayesian Theory and Its Preliminary Experiments[J]. Meteorological Monthly, 39(1): 1-10. DOI: 10.7519/j.issn.1000-0526.2013.01.001.

[复制英文]

资助项目

国家自然科学基金(41075035) 资助

第一作者

韩焱红.主要从事集合预报应用研究.Email: hanyanhong.1988@163.com。

通信作者

矫梅燕. 主要从事天气预报研究. Email: jiaomy@cma.gov.cn

文章历史

2012年4月25日收稿
2012年9月03日收修定稿

Contents Abstract Full text Figures/Tables PDF

基于贝叶斯理论的集合降水概率预报方法研究

韩焱红 ¹, 矫梅燕 ², 陈静 ³, 陈法敬 ³

1. 南京信息工程大学大气科学学院，南京 210044；
2. 中国气象局，北京 100081；
3. 中国气象局数值预报中心，北京 100081

2012年4月25日收稿；2012年9月03日收修定稿

资助项目：国家自然科学基金(41075035) 资助

第一作者：韩焱红.主要从事集合预报应用研究.Email: hanyanhong.1988@163.com

通信作者：矫梅燕. 主要从事天气预报研究. Email: jiaomy@cma.gov.cn

摘要：将贝叶斯理论应用到集合降水概率预报方法研究中。采用集合预报资料和历史观测资料，通过建立贝叶斯产品处理技术(Bayesian Processor of output，BPO)降水概率预报模型，将一组集合成员降水确定预报值修订为一组贝叶斯降水概率分布或概率密度的预报，并获得表征每个集合成员预报能力有效信息评分(Informativeness Score，IS)。基于IS值对集合成员概率预报信息融合，得到集成贝叶斯降水概率预报，并采用连续等级概率评分(Continuous Ranked Probablity Score, CRPS)方法检验试验结果。结果表明，基于BPO方法得到的集成贝叶斯降水概率预报可靠性高于由集合预报得到的直接概率预报。

关键词：贝叶斯理论降水集合预报概率预报试验

Study on the Method of Rainfall Ensemble Probability Forecast Based on Bayesian Theory and Its Preliminary Experiments

HAN Yanhong¹, JIAO Meiyan², CHEN Jing³, CHEN Fajing³

1. School of Atmospheric Science, Nanjing University of Information Science and Technology, Nanjing 210044;
2. China Meteorological Administration, Beijing 100081;
3. CMA Numerical Prediction Centre, Beijing 100081

Abstract: The paper applies BPO (Bayesian Processor of Output) method based on Bayesian theory to the method of rainfall ensemble probability forecast. Using ensemble prediction data and historical observational data, we develop a rainfall probability forecast model, and then revise a set of precipitation predicted value into a set of Bayesian precipitation probability forecast in the form of continuous probability distribution or continuous probability density. Besides, we obtain a group value of Informativeness Score (IS), which can express the prediction ability of each ensemble member. Furthermore, we fuse the probability forecast results of each member into an integration Bayesian precipitation probability forecast on the basis of IS and test the results with Continuous Ranked Probablity Score (CRPS). Experiment results show that the reliability of integration Bayesian precipitation probability forecast is higher than ensemble direct probability forecast.

Key words: Bayesian theory precipitation ensemble forecast probability forecast experiments

引言

天气预报存在着不可避免的不确定性(Lorenz, 1963; 1965), 概率是表达预报不确定性的一种方式(王东海等，2011)，集合预报(杜钧等，2010；矫梅燕，2010；陈静等，2002)则是获得概率预报的一个有效途径。集合预报产品的释用是集合预报系统必不可少的一部分，是实现模式结果实际应用价值的重要过程。目前的集合预报释用方法主要以模式预报值为样本，统计得到一系列概率预报结果，如天气要素概率预报图、邮票图和面条图等。由于集合预报系统在获得不确定性来源过程中仍存在一定缺陷，由此得到的直接概率预报结果并不能完整地定量化表达不确定性，因此，近年来国内外气象学者逐渐研究基于贝叶斯理论的概率预报方法来解决这一问题。

贝叶斯理论是统计学中的一个重要分支，在水文预报及气象预报等领域有所应用。从20世纪90年代开始，基于贝叶斯理论的水文模拟不确定性估计方法被广泛地应用于模拟方法、参数估计和水文预报等方面，成为水文不确定性研究的主流方向。90年代末，气象学者将贝叶斯理论应用于单一数值预报产品的概率化预报中，如Krzysztofowicz(1983；1999a)提出了贝叶斯产品处理技术(Bayesian Processor of output, BPO)，采用模式预报值作为预报因子，通过建立BPO预报模型对预报量先验概率修订，得到预报量累积概率分布或概率密度的预报。随着数值预报技术的发展，集合预报逐渐发展成熟，近年来贝叶斯理论也逐渐应用于该研究领域，Raftery(2005)提出了贝叶斯模式平均(Bayesian Model Averaging，BMA)的方法，利用地面温度历史集合预报资料，将单个集合成员预报结果修订为概率密度函数形式的预报, 但由于模式集合平均与气候平均有很大差别，该方法对于极端事件的预报不够准确。Bishop(2008)对上述方法进一步地改进，将气候分布与贝叶斯理论结合得到既适用于非极端事件又适于极端事件的概率预报。中国气象局也于2010年开始这方面的研究，赵琳娜等(2011)采用淮河流域历史降水资料及集合预报资料利用BMA方法对中国气象局(CMA)集合预报15个成员的定量降水预报进行了集成与订正，得到有预测效果的概率密度函数，使得观测降水真值包含在有效区间预报内的可能性更大，获得预报能力高于确定预报的概率预报。陈法敬等(2011)以连续预报量—温度为例，对BPO方法在集合预报中的应用进行了初步试验验证，将一组集合成员预报值修订为一组概率预报并对其预报结果合理融合得到预报能力高于单一集合成员的集成贝叶斯概率预报。

由前人基于贝叶斯理论的概率预报结果可以看出，采用数值模式产品提供的有效预报信息对预报量的气候(先验)概率进行修订，得到模式预报信息与气候信息最佳融合的概率预报可以提高预报准确性。降水作为离散型预报量，其概率预报形式一般有两种：降水有无的分类概率预报和降水量等级概率预报。实际上，降水量在[0, ∞)内的各个连续值处都存在一定概率，获得该范围内连续的概率分布或概率密度预报可以更加完整地体现预报不确定性。本文以24小时降水为预报量，集合成员预报值为确定预报值，根据BPO方法(Krzysztofowicz et al, 2001; Krzysztofowicz, 1999)建立降水概率预报模型，获得一组在预报范围内连续变化的降水概率分布或概率密度预报，并按照预报能力对各集合成员贝叶斯降水概率预报信息融合，获得集成贝叶斯降水概率预报。

1 方法和资料 1.1 方法 1.1.1 贝叶斯方法

贝叶斯方法是基于贝叶斯定理而发展起来用于系统地阐述和解决统计问题的方法(茆诗松，1999；吴喜之，2000)。该方法的核心为贝叶斯公式，其基本形式如下：

$ {P}{\rm{(}}{Y}{\rm{|}}{X}{\rm{) = }}\frac{{{P}{\rm{(}}{Y}{\rm{)}}{P}{\rm{(}}{X}{\rm{|}}{Y}{\rm{)}}}}{{{P}{\rm{(}}{X}{\rm{)}}}} $

(1)

式中，P(Y)是未知数Y的先验概率，它是由已知的先验信息获取的最初概率，反映了人们在抽样前对Y的认知；P(X|Y)则是样本值X的抽样分布密度, 其综合了未知数Y的样本信息和总体信息(综合称为抽样信息)；P(X)为随机变量X的边缘分布。公式表达了通过抽取样本X，利用抽样信息对未知数Y的先验概率进行修订，得到重新估计的条件概率即后验概率P(Y|X)的算法。

1.1.2 BPO方法

BPO方法是一种将贝叶斯理论运用到气象领域，通过融合预报量先验信息，将单一数值模式预报值修订为概率预报的技术。本文选取降水作为预报量Y，将单一集合成员降水预报值作为预报因子X。由于离散型预报量降水总体上可以分为有无降水两种情况，而在有降水条件下的降水量(以下简称为条件降水量)的分布在(0, ∞)范围内是连续的。因此为了得到降水在[0, ∞)预报值范围内连续的概率分布预报，分别对有降水的概率和条件降水量的概率分布修订，得到有降水的后验概率π及条件降水量的后验概率分布Φ(y)或后验密度函数ϕ(y)。基于BPO方法的降水概率预报数学模型如式(2) 或(3) 所示，式中x为预报因子X的值，y为≥0的任意实数，δ(y)为y的狄拉克函数。由公式可以看出，基于BPO方法得到的降水概率预报由两部分构成：无降水的概率和条件降水量的概率分布。

概率分布形式：

$ P\left( {Y \le y|X = x} \right) = \left( {1 - \pi } \right) + \pi \mathit{\Phi }\left( y \right),y \ge 0 $

(2)

概率密度形式：

$ P\left( {y|X = x} \right) = \left( {1 - \pi } \right)\delta \left( y \right) + \pi \phi \left( y \right),y \ge 0 $

(3)

降水概率预报模型中有降水的后验概率π由公式(4) 获得，式中g为由历史降水观测资料统计得到的有降水先验概率(降水阈值为0.1 mm)。f₀、f₁则分别为无降水和有降水时，由降水观测值、预报值构成的联合样本获得的预报值x的条件密度函数即似然函数。

$ \pi = {\left[ {1 + \frac{{1 - g}}{g}\frac{{{f_0}\left(x \right)}}{{{f_1}\left(x \right)}}} \right]^{ - 1}} $

(4)

模型中条件降水量的后验概率分布Φ(y)和后验概率密度ϕ(y)则分别由式(5) 和(6) 获得。公式中Q代表标准正态分布函数；G(y)、K(x)则是分别由降水历史观测值样本、预报值样本估计得到的条件降水量y的先验概率分布、预报值x的边缘分布；c₀、c₁和T为通过建立似然模型得到的后验参数。

概率分布函数形式：

$ \mathit{\Phi }\left(y \right) = Q\left\{ {\frac{1}{T}\left[ {{Q^{ - 1}}G\left(y \right) - {c_1}{Q^{ - 1}}K\left(x \right) - {c_0}} \right]} \right\} $

(5)

概率密度函数形式：

$ \begin{array}{l} \phi \left(y \right) = \frac{1}{T}\exp \left({\frac{1}{2}\left\{ {{{\left[ {{Q^{ - 1}}G\left(y \right)} \right]}^2} - } \right.} \right.\\ \;\;\;\;\;\;\;\;\;\;\;\left. {\left. {{{\left[ {{Q^{ - 1}}\mathit{\Phi }\left(y \right)} \right]}^2}} \right\}} \right)g\left(y \right) \end{array} $

(6)

似然模型是为了获得表征预报量和预报因子之间依赖关系的似然参数而建立的数学模型。由于降水观测值与预报值并不服从标准正态分布，其分布特征使得两者之间的依赖关系难以用解析函数来刻画，因此本文采用Kelly等(1997)和Krzysztofowicz(1997)提出的亚高斯似然模型来获得似然参数。其主要思想是先通过正态分位数转换(Normal Quantile Transform, NQT)将预报量y、预报因子x变换为正态分布变量u、z，如式(7)。

$ u = {Q^{ - 1}}G\left(y \right), z = {Q^{ - 1}}K\left(x \right) $

(7)

式中，Q^-1表示标准正态分布函数反函数，因此转换后的变量均完全服从标准正态分布(高斯分布)。在转换空间内建立的似然模型则为亚高斯似然模型，根据u、z的均值μ₀、μ₁, 方差σ₀²、σ₁²以及协方差σ₁₀通过式(8) 得到似然参数a、b和σ²，以此来描述NQT转换量u、z之间的线性回归关系，如式(9) 所示。

$ a = \frac{{{\sigma _{10}}}}{{\sigma _0^2}},b = {\mathit{\mu }_1} - \frac{{{\sigma _{10}}}}{{\sigma _0^2}}{\mathit{\mu }_0},{\sigma ^2} = \sigma _1^2 - \frac{{\sigma _{10}^2}}{{\sigma _0^2}} $

(8)

$ E\left( {Z|U = u} \right) = au + b,Var\left( {Z|U = u} \right) = {\sigma ^2} $

(9)

式中，E为降水观测值Y的NQT转换量U值为u时，预报值X的转换量z的期望，Var则为其方差。同时，通过建立似然模型分别由式(10) 和(11)，获得表征预报因子有效信息评价指标的有效信息评分(Informativeness Score, IS)(Krzysztofowicz, 1992)及BPO预报模型中的后验参数。

$ IS = \left| \gamma \right| = {\left[ {{{\left({\frac{a}{\sigma }} \right)}^{ - 2}} + 1} \right]^{ - \frac{1}{2}}} $

(10)

$ {c_1} = \frac{a}{{{a^2} + {\sigma ^2}}}, {c_0} = \frac{{ - ab}}{{{a^2} + {\sigma ^2}}}, T = {\left({\frac{{{\sigma ^2}}}{{{a^2} + {\sigma ^2}}}} \right)^{1/2}} $

(11)

1.2 资料

本文选取了5个不同气候区的代表站点:广州、南京、武汉、成都和北京站。将站点24 h降水量作为预报量Y，集合预报系统中单一集合成员24 h降水预报值(预报时效为24、72和120 h)作为预报因子X。

其中降水的先验概率由国家气象信息中心提供的全国基准站1952—2007年6月逐日20—20时24 h降水观测资料获得。为了研究BPO方法在多模式集合预报中的应用，本文预报因子X是由交互式全球大集合预报系统(THORPEX Interactive Grand Global Ensemble，TIGGE)提供的中国气象局(CMA)与美国环境预报中心(NCEP)逐日24、72和120 h预报时效的全球格点降水预报资料利用双线性插值方法得到广州、南京、武汉、成都和北京站5个观测站的降水预报，试验时段为2008年6月1—30日期间。

2 基于确定性预报的降水概率预报模型试验 2.1 降水概率预报模型的应用实例

以CMA和NCEP集合预报资料中集合控制预报值作为确定性预报值，对基于BPO方法的降水概率预报模型进行应用试验。

分别对广州、南京、武汉、成都和北京站建立BPO降水概率预报模型，得到5个站点的6月逐日有降水的后验概率π_k，其与历史观测资料统计得到的先验概率g_k比较结果如图 1所示(k为6月中的第k天)。

图 1 广州(a)、武汉(b)、南京(c)、成都(d)和北京(e)站点6月逐日有降水先验概率g_k与后验概率π_k Fig. 1 The prior probability (

) of precipitation occurrence g_k and posterior probability π_k (

) of each day in June at stations Guangzhou (a), Wuhan (b), Nanjing (c), Chengdu (d), and Beijing (e)

由图 1可以看出，根据降水历史观测资料统计得到的站点有降水先验概率g_k逐日变化平缓，其中广州站的g_k值在0.45~0.75之间(如图 1a)，武汉和成都站的g_k值在0.3~0.7之间(如图 1b和1d), 南京和北京站的g_k值在0.2~0.5之间(如图 1c和1e)。而通过建立BPO降水概率预报模型修订得到的后验概率π_k逐日变化起伏较大，这说明数值预报值作为预报因子，提供的预报因子有效信息发挥了一定修订作用。

将历史观测资料中有降水时的降水观测值作为条件降水量的历史观测样本，与其对应的集合预报控制预报值作为历史预报值样本，通过统计分析发现广州、南京、武汉、成都和北京站的6月逐日条件降水量近似服从威布尔分布。因此，本文采用威布尔分布函数估计条件降水量的先验分布G(y)和预报值的边缘分布K(x)。

$ G\left({y\left| {\alpha, \beta } \right.} \right) = 1 - {{\rm{e}}^{ - {{\left({\frac{y}{\alpha }} \right)}^\beta }}}, y > 0 $

(12)

以广州站2008年6月29日为例，条件降水量的先验分布G(y)及预报值边缘分布K(x)如图 2a所示。可以看出，条件降水量Y、预报值X的威布尔分布形状与尺度存在差异，两者之间的统计关系难以统一刻画。分别对其进行NQT转换，得到条件降水量、预报值的NQT转换量U、Z，其分布形式如图 2b所示。转换量U、Z均服从标准正态分布，分布曲线完全重合，便于似然模型的建立。

图 2 条件降水量的边缘分布G(y)及预报值的边缘分布K(x)(a)和NQT转换量U、Z的标准正态分布Q(u)及Q(z)(b) (以广州2008年6月29日为例) Fig. 2 The marginal distribution G of predictand y and marginal distribution K of predictor x (a) and the standard normal distribution of NQT transformed u and z (b) (Take Guangzhou 29 June 2008 as example)

以CMA和NCEP集合预报为例，在转换空间内分别建立5个研究站点的似然模型，得到后验参数c₀、c₁和T, 结果如表 1和表 2所示。

表 1 站点后验参数值(以CMA集合成员为例) Table 1 Posterior parameters at five stations (Take CMA ensemble member as example)

表 2 站点后验参数值(以NCEP集合成员为例) Table 2 Posterior parameters at five stations (Take NCEP ensemble member as example)

利用表 1中广州站的后验参数值，由式(6) 得到给定任意4个预报因子值(X=10、20、35和55 mm)时的条件降水量后验概率密度函数，如图 3所示。

图 3 条件降水量Y的先验概率密度G(y)及给定任意4个预报因子X值(X=10、20、35和55 mm)的后验概率密度ϕ(y|x=10), ϕ(y|x=20), ϕ(y|x=35) 和ϕ(y|x=55) Fig. 3 The prior density function G(y) and posterior density functions ϕ(y) based on four different predictor realizations x=10, 20, 35 and 55 mm

由图 3可见，预报因子值分别取10、20、35和55 mm时，概率密度峰值对应的降水量分别为1、5、15和35 mm。同时，先验概率密度G(y)的峰值位于条件降水量小值区(倒J型分布)，而预报因子x值愈大，修订得到的后验密度函数ϕ(y)愈圆滑，峰值也随之向降水量大值区移动，而体现了预报因子对概率的修订作用。

2.2 基于确定性预报的降水概率预报结果分析

分别将CMA和NCEP集合预报控制预报值作为确定性预报，对广州、南京、武汉、成都和北京站2008年6月逐日24 h降水建立BPO降水概率预报模型，得到各站点的逐日降水概率分布或概率密度预报。其中，以CMA控制预报对广州2008年6月30日降水, NCEP控制预报对武汉2008年6月21日降水的预报为例，得到确定性预报的概率化结果—单一集合成员贝叶斯降水概率预报的结果如图 4所示。

图 4 贝叶斯降水概率预报与气候概率预报试验结果对比 (a)基于CMA控制预报对广州2008年6月30日的降水预报得到的概率分布预报, (b)同上，但为概率密度预报(Actual:降水实况8.9 mm, forecast:集合预报控制预报值19.3 mm), (c)基于NCEP控制预报对武汉2008年6月21日的降水预报得到的概率分布预报, (d)同上，但为概率密度预报
(Actual:降水实况0.4 mm, forecast:集合预报控制预报值10.93 mm) Fig. 4 Comparisons of Bayesian forecast and climate forecast based on deterministic prediction:(a) cumulative probability prediction taking CMA precipitation forecast on 30 June, 2008 at Guangzhou for example, (b) the same as above but for probability density (actual observation: 8.9 mm, forecast: value 19.3 mm), (c) cumulative probability prediction taking NCEP precipitation forecast on 21 June, 2008 at Wuhan for example, and (b) the same as above but for probability density (Actual observation: 0.4 mm, forecast: 10.93 mm)

由图 4可以看出，广东站的实际观测值为8.9 mm，CMA控制预报结果为19.3 mm, 修订得到的概率密度峰值位于观测值附近(如图 4b)，预报准确性有所提高；武汉站的实际观测值为0.4 mm，NCEP控制预报结果为10.93 mm，修订得到的概率密度峰值同样位于观测值附近(如图 4d)，且预报确定度较高。同时，得到的贝叶斯降水概率预报与确定性预报相比，给出了预报范围内更多的预报信息，并以概率的形式定量化、连续地表达了降水预报不确定性。

本文选取的成都、南京和北京站的试验个例得到的贝叶斯降水概率预报形式与以上广州、武汉站的个例相似，不再赘述。

3 基于集合预报的降水概率预报模型应用 3.1 集合成员的预报模型应用结果

前面阐述了基于确定性预报建立BPO降水概率预报模型，获得单一集合成员贝叶斯降水概率预报的方法。试验结果表明，得到的概率预报具有一定的预报能力。而集合预报的预报不确定性是所有集合成员预报不确定性的完整体现，因此有必要研究一种合理的集合成员概率预报信息融合方法。将集合预报结果包含的一组集合成员预报值(x₁, …, x_n)(n为集合成员数)中每个集合成员预报值视为确定预报数值模式产品，基于BPO方法建立降水概率预报模型，获得一组概率分布预报{P(Y≤y|X=x_i)|i=1, …, n}。以广州站2008年6月4日的24小时降水预报为例，图 5给出CMA集合预报第1、5、9和13集合成员贝叶斯降水概率预报。

图 5 由CMA集合预报第1、5、9、13集合成员对广州2008年6月7日降水量24 h预报值修订得到的降水概率分布预报 (Actual：降水观测值14.4 mm，mb1、mb5、mb9和mb13分别表示集合成员1、5、9和13的预报值1.82、15.26、13.49和2.37 mm) Fig. 5 The probability distribution based on the 1st, 5th, 9th, 13th member of CMA 24 h forecast at Guangzhou on 7 June, 2008 (Actual observation: 14.4 mm; mb1, mb5, mb9, mb13 stand for the forecasts of member1, 5, 9, 13 about 1.82, 15.26, 13.49, 2.37 mm)

由图 5可以看出，降水观测值为14.4 mm，选定的CMA集合成员预报值均小于实况。概率化后的集合成员1和集合成员13的贝叶斯降水概率分布预报较相似，集合成员5和集合成员9的概率分布预报结果近乎重合。这表明，集合成员的降水预报值存在差异，所包含的不确定信息不同，因此其概率分布预报也有所区别。

3.2 基于集合成员贝叶斯降水概率预报结果的集成方法

由于集合成员为预报提供的有效预报信息存在差异，其预报能力也有所不同。本文采用在亚高斯似然模型中获得的预报因子有效信息评分IS值表征其预报能力。IS值的范围为[0, 1]，且IS值越大，预报因子包含的有效预报信息越多，集合成员的预报能力越高。分别基于CMA和NCEP集合预报成员对南京站24、72和120 h的降水预报值建立亚高斯似然模型，根据式(10) 得到各集合预报成员的IS值，其中NCEP集合成员的结果如图 6a所示。

图 6 基于NCEP集合预报对南京站降水预报得到的IS值(a)和权重系数r(IS_i)(b) Fig. 6 The IS (a) and r_i(IS_i) (b) obtained based on NCEP ensemble forecast for Nanjing precipitation

由图 6a可见，基于NCEP集合成员24 h降水预报得到的IS值明显高于72和120 h，其中预报能力最强的为集合成员7，预报能力最弱的为集合成员9，IS值分别为0.91和0.70。

IS值可以较好地体现集合成员为预报量提供有效预报信息的能力，因此本文采用正比于IS³的值作为权重系数(陈法敬，2011)来体现不同预报能力的集合成员其预报信息在所有集合成员预报信息融合中的地位，见式(13)。

$ {r_i}\left({I{S_i}} \right) = \frac{{IS_i^3 - \min \left({\mathit{\boldsymbol{I}}{\mathit{\boldsymbol{S}}^3}} \right)}}{{\sum\limits_{i = 1}^n {IS_i^3 - n \cdot \min \left({\mathit{\boldsymbol{I}}{\mathit{\boldsymbol{S}}^3}} \right)} }} $

(13)

式中，min运算为取各集合成员组成的IS³向量中最小的元素，n为集合成员总数。

以NCEP对南京站24 h降水预报为例，获得与图 6a中24 h预报时效的集合成员IS值对应的r_i(IS_i)值，如图 6b所示。

由图 6b可见，权重系数的变化趋势与IS值一致，对于24 h预报能力最强的集合成员7，其预报信息的权重系数r_i(IS_i)值也最大，预报能力最弱的集合成员9，其预报信息的权重系数r_i(IS_i)值最小，r_i(IS_i)值分别为0.11和0。

另外，分别基于CMA和NCEP集合预报对广州、武汉、成都和北京站24、72和120 h降水预报得到集合成员IS值以及24 h降水预报信息的权重系数r_i(IS_i)。结果表明，权重系数可以很好地体现不同预报能力的集合成员其预报信息在融合中的地位。同时，各站的IS值变化特征与南京相似，两个集合预报系统对24 h降水预报能力均明显高于72和120 h预报。

基于权重系数r_i(IS_i)根据式(14) 对一组集合成员概率密度预报信息加权平均且归一化，得到融合后的集成贝叶斯降水概率密度预报。由式(15) 对概率密度函数积分，得到概率分布预报。

$ p\left({y|\mathit{\boldsymbol{X}}} \right)\mathit{\boldsymbol{ = }}\frac{{\sum\limits_{i = 1}^n {p\left({y|{x_i}} \right) \cdot {r_i}\left({I{S_i}} \right)} }}{{\int\limits_0^\infty {\left[ {\sum\limits_{i = 1}^n {p\left({\xi |{x_i}} \right) \cdot {r_i}\left({I{S_i}} \right)} } \right]} {\rm{d}}\mathit{\xi }}} $

(14)

$ p\left({Y \le y|\mathit{\boldsymbol{X}}} \right)\mathit{\boldsymbol{ = }}\int\limits_0^y {p\left({\xi |\mathit{\boldsymbol{X}}} \right)} {\rm{d}}\mathit{\xi } $

(15)

3.3 集成贝叶斯降水概率预报结果分析及检验

以NCEP对广州2008年6月8日的24 h降水预报为例，分别对各集合预报成员建立BPO降水概率预报模型，获得一组集合成员贝叶斯降水概率预报，并根据式(14) 和(15) 对预报信息融合，得到集成贝叶斯降水概率预报，如图 7所示。

图 7 NCEP对广州2008年6月8日24 h降水的集合模式直接概率预报(集合预报)，气候概率预报预报(气候预报)和集成贝叶斯降水概率预报(集成预报) (a)概率分布形式, (b)概率密度形式
(Actual：降水观测值24.8 mm, En.Mean：集合平均值11.28 mm) Fig. 7 NCEP 24 h ensemble forecasts at Guangzhou on 7 June 2008 from the ensemble direct probability forecast (Ensemble Forecast), climate probability forecast (Climate Forecast), and integration Bayesian precipitation probability forecast (Integrated Forecast): (a) probability distribution, and (b) probability density
(Actual observation: 24.8 mm, ensemble mean: 11.28 mm)

由图 7可以看出，个例的降水观测值为24.8 mm，NCEP集合预报给出的累积概率在此处已达到极值1，概率密度为0。集合模式直接概率预报的概率密度峰值主要位于9、13和15 mm，对应的降水等级范围则为小到中雨。修订得到的集成概率分布和概率密度预报在预报范围内是连续变化的曲线，且降水观测值处的概率密度有所提高，增加了预报的可靠性。

分别基于CMA和NECP集合预报对广州、南京、北京、成都和武汉的2008年6月逐日24 h降水预报，建立BPO降水概率预报模型，得到站点逐日集成贝叶斯降水概率预报。采用连续等级概率评分(Continuous Ranked Probability Score, CRPS)对各站点的概率预报结果进行检验，CRPS值越小说明概率预报可靠性越高，预报结果越接近真实情况。

图 8给出了5个站点集成贝叶斯降水概率预报和集合直接概率预报的6月CRPS评分均值，其中图 8a和8b是分别为基于CMA和NCEP集合预报得到的检验结果。

图 8 站点集成贝叶斯降水概率预报(集成预报)和集合直接概率预报(集合预报)的6月CRPS评分均值(a)基于CMA集合预报得到的结果, (b)基于NCEP集合预报得到的结果 Fig. 8 Mean value of CRPS in June of integration Bayesian precipitation probability forecast (Integrated Forecast) and ensemble direct probability forecast (Ensemble Forecast) at the stations (a) based on CMA ensemble forecast, and (b) based on NCEP ensemble forecast

由图 8可以看出，基于CMA和NCEP集合预报得到的广州、武汉、南京、成都和北京站6月集成贝叶斯降水概率预报的CRPS评分均值明显小于集合直接概率预报，即集成贝叶斯降水概率预报的准确性高于集合直接概率预报。同时，各站点的集成预报与集合预报的CRPS评分变化趋势一致，说明得到的集成贝叶斯降水概率预报的预报效果仍基于集合预报结果。其中，基于CMA和NCEP集合预报获得的集成贝叶斯降水概率预报均对广州站的预报准确性改进最大。基于CMA集合预报得到的集成预报结果中，武汉站的CRPS值最小，预报准确性最高，基于NCEP集合预报得到的集成预报结果中，南京站的CRPS值最小，预报准确性最高。

综上所述，分别基于CMA和NCEP集合预报对广州、武汉、南京、成都和北京站的2008年6月逐日24 h降水建立降水概率预报模型并采用CRPS评分检验。结果表明，各站点的集成贝叶斯降水概率预报的可靠性均高于集合直接概率预报，并对广州站的概率预报准确性有较大提高，这种基于贝叶斯理论的集合降水概率预报方法经试验证明是科学合理的。

4 结论

采用1952—2007年历史观测资料、2008年集合预报资料对基于贝叶斯理论的集合降水概率预报方法进行初步应用试验，得到以下结论：

(1) 基于BPO方法对广州、武汉、南京、成都和北京站6月逐日有降水的先验概率g修订得到的后验概率π逐日变化明显，预报值提供的预报因子有效信息发挥了修订作用。

(2) 得到的单一集合成员贝叶斯降水概率预报与确定性预报相比，给出了预报范围内更多的预报信息，并以概率的形式定量化、连续地表达了降水预报的不确定性。

(3) 每个集合成员的预报性能存在差异，以IS值表征集合成员的预报能力，结果表明集合成员预报能力随着预报时效增加而降低。用正比于IS³的值作为权重系数可以有效地体现不同预报能力的集合成员其预报信息在融合集成中的地位。

(4) 采用CRPS方法对5个研究站点的集成贝叶斯降水概率预报和集合直接概率预报检验，结果表明，基于BPO方法得到的集成预报可靠性高于集合预报，并对广州站的概率预报准确性有较大提高，该降水概率预报方法具有合理性。

文中采用双线性插值的方法由格点集合预报资料得到站点降水预报值，存在一定误差，对试验结果略有影响；试验样本长度仅为1个月，较小的样本量可能导致存在较大的预报模型偏差，其结果的代表性不是很强。另外值得注意的是，本文根据历史观测资料，采用威布尔分布估计得到的气候分布作为先验信息，其方法及结果存在一定局限性。由于先验信息的获取有多种途径，因此还可以尝试其他先验信息的估计方法，并与本文所得结果做进一步对比。下一步的工作将针对上述缺陷进行改进，对基于贝叶斯理论的集合降水概率预报方法进一步深入研究。

参考文献

陈法敬, 2011. 亚高斯贝叶斯预报处理器及其初步试验[J]. 气象学报, 69(5): 872-882. DOI:10.11676/qxxb2011.076

陈法敬, 矫梅燕, 陈静, 2011. 一种温度集合预报产品释用方法的初步研究[J]. 气象, 37(1): 14-20. DOI:10.7519/j.issn.1000-0526.2011.01.002

陈静, 陈德辉, 颜宏, 2002. 集合数值预报发展与研究进展[J]. 应用气象学报, 13(4): 497-507.

杜钧, 陈静, 2010. 单一值预报向概率预报转变的基础:谈谈集合预报及其带来的变革[J]. 气象, 36(11): 1-11. DOI:10.7519/j.issn.1000-0526.2010.11.001

矫梅燕, 2010. 天气业务的现代化发展[J]. 气象, 36(7): 1-4. DOI:10.7519/j.issn.1000-0526.2010.07.002

茆诗松, 1999. 贝叶斯统计[M]. 北京: 中国统计出版社, 12-30.

王东海, 杜钧, 柳崇健, 2011. 正确认识和对待天气气候预报的不确定性[J]. 气象, 37(4): 385-391. DOI:10.7519/j.issn.1000-0526.2011.04.001

吴喜之, 2000. 现代贝叶斯统计学[M]. 北京: 中国统计出版社, 10-35.

赵琳娜, 梁莉, 王成鑫, 等. 2011. 基于贝叶斯模型平均的集合降水预报偏差订正. 第28届中国气象学会年会——S3天气预报灾害天气研究与预报.

Bishop C, 2008. Bayesian model averaging's problematic treatment of extreme weather and a paradigm shift that fixes it[J]. Mon Wea Rev, 136(12): 4641-4652. DOI:10.1175/2008MWR2565.1

Kelly K, Krzysztofowicz R, 1997. A bivariate meta-Gaussian density for use in hydrology[J]. Stoch Hydrol Hydraul, 11(1): 17-31. DOI:10.1007/BF02428423

Krzysztofowicz R, 1983. Why should a forecaster and a decision maker use Bayes theorem[J]. Water Resour Res, 19(2): 327-336. DOI:10.1029/WR019i002p00327

Krzysztofowicz R, 1992. Bayesian correlation score: A utilitarian measure of forecast skill[J]. Mon Wea Rev, 120(1): 208-220. DOI:10.1175/1520-0493(1992)120<0208:BCSAUM>2.0.CO;2

Krzysztofowicz R, 1997. Transformation and normalization of variates with specified distributions[J]. J Hydrol, 197(1-4): 286-292. DOI:10.1016/S0022-1694(96)03276-3

Krzysztofowicz R, 1999a. Point-to-area rescaling of probabilistic quantitative precipitation forecasts[J]. J App Meteorol, 38(6): 786-796. DOI:10.1175/1520-0450(1999)038<0786:PTAROP>2.0.CO;2

Krzysztofowicz R, 1999b. Bayesian theory of probabilistic forecasting via deterministic hydrologic model[J]. Water Resour Res, 35(9): 2739-2750. DOI:10.1029/1999WR900099

Krzysztofowicz R, Herr H D, 2001. Hydrologic uncertainty processor for probabilistic river stage forecasting: Precipitation-dependent model[J]. J Hydrol, 249(1-4): 46-68. DOI:10.1016/S0022-1694(01)00412-7

Lorenz E N, 1963. Deterministic nonperiodic flow[J]. J Atmos Sci, 20(3): 130-141.

Lorenz E N, 1965. A study of the predictability of a 28-variable atmospheric models[J]. Tellus, 17(3): 321-333. DOI:10.3402/tellusa.v17i3.9076

Raftery A, 2005. Using Bayesian model averaging to calibrate forecast ensembles[J]. Mon Wea Rev, 133(5): 1155-1174. DOI:10.1175/MWR2906.1