2. 中国气象局气象干部培训学院,北京 100081
2. China Meteorological Administration Training Centre, Beijing 100081
随着我国气象现代化建设的迅速发展,已形成了由地基、空基和天基构成的综合气象观测体系。目前,已建成气象基本要素24 h连续观测的国家级自动站2400余个、各类加密自动站及暴雨监测站37000余个,在灾害的监测预警、数值预报和决策服务等方面发挥了重要作用。然而由于设备故障等原因,自动站观测数据可能存在错误,因此需研发有效的质控方法检测错误数据。依托“综合气象观测系统运行监控平台”(ASOM),气象探测中心已研发出针对自动站的数据质控算法,并实现了业务化运行,但该算法中针对降雨量的数据质控算法比较薄弱,仅包含设备的界限值检查等基本方法且存在较多漏检。此外国内外针对小时降雨量的质控算法研究较少,因此亟待开发新的算法满足业务需求。
目前,时空一致性检验是常用的质控方法之一。时间一致性方法通过分析单站时间序列资料是否存在连续相同值超过规定时间尺度, 判断数据是否存在错误;而空间一致性方法通过和周围站点观测数据的对比,判别是否存在偏离正常范围的异常数据(Gonázlez-Rouco et al, 2000; 任芝花等, 2010; 2015)。然而降雨过程极为复杂,具有局地性和不连续性的特点,因此时空一致性检验方法对解决降雨量尤其是小时降雨量的质控问题存在一定的局限性。
分析降雨与其他观测要素的关系、雷达与自动站测量降雨量的一致性检验结果,可考虑综合多方面的信息解决小时降雨量的质控问题。一方面,当降雨发生时,地面自动站测量的相对湿度和温度露点差与降雨关系密切,此外尤其在发生较强降雨时降雨前后的风速变化和气温变化通常比较剧烈,这些规律为研究新的质量控制方法提供了一种新的思路(李亚丽等,2015)。另一方面,天气雷达作为一种定量化测量降雨量的设备已经被广泛应用于气象领域,自1998年起至今我国新一代多普勒天气雷达网的建设已经基本完成,雷达探测范围已覆盖我国大部分地区并对强天气的预警和监测都起到了重要的作用(俞小鼎等, 2006; 李柏等, 2011)。虽然天气雷达在估测降雨量准确性方面还存在一定误差,但天气雷达具备短时间内探测区域雨量的能力(Doviak et al, 2006)使其成为检验地面自动站观测降雨量的重要探测设备。
1 资料雷达测量的面降雨量资料由全国158部新一代多普勒天气雷达基数据经过数据质量控制、混合扫描基础上的反射率因子拼图和Z-I关系的反演等步骤获得。自动站观测资料来源于2409套国家级自动站(基准站、基本站和一般站)上传的报文,包括降雨量、气温、露点温度、相对湿度、风速等观测要素。天气雷达和自动站收集数据的时间段为2010—2012年的5—10月,资料的时间分辨率均为1 h。所有研究资料均来源于中国气象局气象探测中心。在选用资料时考虑到雷达有效探测范围和波束阻挡等因素,因此不考虑雷达有效探测范围之外和波束阻挡严重区域的自动站。此外,针对自动站数据质量情况,ASOM系统根据业务需求开发了一套数据质量控制算法实时检查站点数据质量,算法主要包括界限值检查、区域气候极值检查、持续性检查、空间一致性检查、内部一致性检查等。在统计雷达和自动站测量降雨量的检查阈值时不考虑存在降雨量数据存在错误的站点;在统计降雨时各研究要素的检查阈值时,不考虑存在数据错误的站点。文中选择的新一代多普雷天气雷达和国家级自动站站点分布情况如图 1所示。
考虑到降雨的特点,时间连续性检查主要检测数据连续无变化的情况(任芝花等, 2010),在本研究中降雨量大于0且相同值持续超过6 h以上判定为错误。而空间一致性检查使用四分位检查方法(Gonázlez-Rouco et al, 2000; Wilks, 1995),该方法首先获取研究站点周围所有观测到的降雨量数据{x1, x2, …, xn},然后对观测数据从小到大进行排序{x(1), x(2), …, x(n)},接着根据数据序号分别计算出1/4和3/4处的分位数值q1/4和q3/4进而计算出四分位数间距(interquartile range,IQR),最后通过计算检查上限值Pout来判断检验值是否正确,即降雨量值如果大于Pout则判断该值为奇异值否则为正确值。q1/4、q3/4、IQR和Pout的计算公式如下:
$ {q_p}\left\{ \begin{array}{l} {x_{((n + 1) \times t)}}{\rm{, }}\;\;\;\;\;\;\;\;\;\;n{\rm{奇数}}\\ \frac{{{x_{(nt)}} + {x_{(nt + 1)}}}}{2}, \;\;\;\;\;\;\;\;n{\rm{偶数}} \end{array} \right. $ | (1) |
$ IQR = {q_{3/4}} - {q_{1/4}} $ | (2) |
$ {P_{out}} = {q_{3/4}} + 3IQR $ | (3) |
式中,qp表示分位数值,t等于1/4或3/4,n表示数据序列总个数。
2.2 降雨量的多要素综合质量控制方法本文提出的降雨量的多要素综合质量控制方法分别考虑雷达探测范围能够覆盖自动站站点和雷达探测范围不能覆盖自动站站点两种情况。雷达探测范围能够覆盖自动站站点的情况使用雷达和自动站资料联合检验方法(MRAWS),并能给出定量的检验结果;而雷达探测范围不能覆盖自动站站点的情况则采用自动站资料检验方法(MAWS),由于MAWS使用其他与降雨相关要素检验属于间接检验方法,因此仅能给出定性的检验结果。降雨量的多要素综合质量控制方法流程如图 2所示。
当降雨发生时,一般都会感到气温降低、风速增大,俗话说山雨欲来风满楼,就是对这一现象的描述。因此本研究选用气温变化值、风速变化值、相对湿度和温度露点差四个要素作为检验因子。在分析降雨时气温和风速变化检验、相对湿度和温度露点差检验的基础上,本文提出了使用自动站气象站资料检验降雨量是否正确的方法(MAWS),其流程见图 3。
对于科学分析需要统计数据支撑,本研究针对质量控制的特点对降雨发生时气温变化值、风速变化值、相对湿度和温度露点差的均值和标准差进行了统计和分析,资料来自国家站2011年5—10月1 h间隔的观测数据。均值和标准差的计算公式(魏凤英, 2007)如下:
$ \bar x = ({x_1} + {x_2} +, ..., + {x_n})/n $ | (4) |
$ std = \sqrt {\sum\limits_{i = 1}^n {{{({x_i} - \bar x)}^2}/n} } $ | (5) |
式中,x表示研究要素,x表示均值,i表示标号,n表示样本个数,std表示标准差。
参考小时降雨量等级的划分(李爱贞等, 2004),分别以2.5、8.0、16和32.0 mm·h-14个阈值计算气温变化、风速变化、相对湿度和温度露点差的均值和标准差。结果如图 4和图 5所示。从图 4中可以看出,对于均值而言,气温变化和温度露点差随着阈值的增加而呈递减趋势, 而极大风速变化和相对湿度则呈递增趋势,其中气温变化值均值超过2.5℃,极大风速变化均值超过0.9 m·h-1,相对湿度平均值均大于92.2%、温度露点差平均值均小于1.45℃。对标准差的分析表明,气温变化、风速变化、相对湿度和温度露点差的标准差随阈值的增加基本呈递增趋势,气温变化的标准差在2.4~2.9℃,风速变化的标准差介于3.3~4.4 m·s-1,相对湿度在6.1%~7.6%,温度露点差在1.3~2℃。
在分析各要素均值和标准差的基础上,对每个单一的要素都使用标准差的检验方法,其计算公式如下所示:
$ \left| v \right| > m \times std $ | (6) |
式中,|v|表示研究要素的绝对值,std表示标准差,m表示标准差的倍数。m可以根据实际需要选取,在本研究中相对湿度和温度露点差检验的m值定为3,极大风速变化和气温变化检验的m值定为1。
每种检验在分别给出检验结果的基础上,通过综合评分给出最终检验结果。其中总分为100分,气温变化和风速变化检验分别为20分、相对湿度和温度露点差检验分别为30分。评分公式如下所示:
$ Score = {S_t} \times {R_t} + {S_w} \times {R_w} + {S_h} \times {R_h} + {S_{td}} \times {R_{td}} $ | (7) |
式中,St、Sw、Sh和Std分别表示气温变化、风速变化、相对湿度和温度露点差的权重分值,Rt、Rw、Rh和Rtd分别表示每种检验的结果,判别结果正确则为1否则为0。总分大于60分则判定正确,反之则判定错误。
2.2.2 雷达和自动站资料联合检验方法(MRAWS)由于我国新一代天气雷达的建设,雷达测量的面雨量资料为自动站降雨量的质控提供了一种新的途径(李雁等, 2013)。在2.2.1使用自动站资料综合质控的基础上,本文又提出了雷达和自动站资料联合检验方法(MRAWS),该方法由气温变化检验、风速变化检验、相对湿度检验、温度露点差检验以及雷达检验组成,并且每种检验都使用标准差的检验方法。每种检验都设有一个权重,其中雷达检验权重为20分、气温变化和风速变化检验分别为15分、相对湿度和温度露点差检验分别为25分,总分为100分。根据每种检验结果和相应权重分值即可给出质量控制的结果。MRAWS流程如图 6所示,公式如下所示:
$ Score = {S_r} \times {R_r} + {S_t} \times {R_t} + {S_w} \times {R_w} + {S_h} \times {R_h} + {S_{td}} \times {R_{td}} $ | (8) |
式中,Sr、St、Sw、Sh和Std分别表示雷达、气温变化、风速变化、相对湿度和温度露点差的权重分值,Rr、Rt、Rw、Rh和Rtd分别表示每种检验对应的结果,正确为1错误为0。
自动站检验的阈值已经在前文中介绍,本节介绍雷达检验的阈值。在雷达与地面自动站降雨量一致性校验的研究中(李雁等, 2013)对降雨量阈值的划分以日降雨量的等级作为小时降雨量的判别等级,这不适用于小时降雨量等级的划分,因此本研究对阈值重修订和计算。以自动站观测的降水量划分为0.6~2.5、2.5~8.0、8.0~16.0、16.0~32.0、32.0~100 mm·h-1五个区间,分别进行逐月统计。雷达和自动站测量降雨量的最小测量值定为0.6 mm·h-1(Xu et al, 2008);2.5、8.0和16 mm·h-1这三个阈值参考了《气象学与气候学基础》一书(李爱贞等, 2004);32 m·h-1则根据研究需要划定;由于多普勒天气雷达反演降雨量上限一般为100 mm·h-1左右(对应雷达约为53 dBz),因此在雷达检验中的统计上限也使用这一数值(俞小鼎等, 2006)。雷达与自动站测量降雨量差值的均值和标准差的计算公式如下所示:
$ \bar d = \frac{{\sum\limits_{k = 1}^n {\left| {{r_k} - {g_k}} \right|} }}{n} $ | (9) |
$ std = \sqrt {\frac{1}{n}\sum\limits_{k = 1}^n {{{\left[ {\left| {{r_k} - {g_k}} \right| - \bar d} \right]}^2}} } $ | (10) |
式中,r和g分别表示雷达和自动站测量的降雨量,n表示样本总数,k表示编号,d表示平均绝对差值,std表示标准差。
表 1和表 2给出的统计结果表明,随着检验阈值的增加,雷达和自动站测量降雨量差值的均值和标准差均呈现增加趋势。这说明两者观测误差随着降雨量的增加而增加,相对而言雷达和自动站测量降雨量的一致性在0.6~32 mm·h-1效果较好,检验结果也较准确。
本研究使用2012年5—10月雷达测量的面雨量数据、国家级自动站观测数据作为检验样本。检验样本总数为6877个,由于设备故障或通讯故障导致的数据错误、要素不全或缺报数据未统计在内,其中自动站观测到降雨而实际未发生降雨的个数为47,发生降雨的个数为6831。检验结果(表 3)表明,无论自动站观测到降雨实际未发生降雨还是自动站观测到降雨实际发生降雨时,MRAWS的检验正确值略高于MAWS,而两者又明显高于MTS。通过以上分析表明,本文提出的降雨量的多要素综合质量控制方法(MRAWS和MAWS)优于时空一致性检测方法,这种优势主要体现在MRAWS和MAWS具备判断降水是否发生的能力。
MRAWS和MAWS明显均高于MTS的原因在于前两者综合使用了多种观测资料,因此优于仅使用单一资料方法的检验效果。MRAWS优于MAWS的原因在于在自动站资料的基础上引入了雷达测量的面雨量资料而解决了仅使用自动站资料无法有效定量化判断降雨量量值的问题。MAWS的表现虽然略低于MRAWS,但其在自动站没有被雷达覆盖的区域就显得格外重要,可以作为另一种比较有效的检验方法应用于自动站测量降雨量的质量控制工作中。同时需要指出的是MRAWS和MAWS也存在一定的不足,即两种方法仅适用于判别有无降水,对降水量值的正确性判断、特别是对大强度降水正确性的判断能力不足。
3.2 定量检验分析由于本文提出的采用综合评分检验降雨量的方法根据实际情况分为MRAWS和MAWS两种,最后以评分作为判断标准。其中MAWS不具备定量检测降雨量的能力,而MRAWS没有直接表现出定量检验降雨量的能力。因此本节通过3个个例进行定量化分析,其中前2个个例为自动站测量降雨量正确的个例,第3个为自动站测量降雨量错误的个例。
3.2.1 多要素综合质控方法对自动站测雨量正确检验分析的个例此次检验分析以北京7.21暴雨过程为例,分析过程如下:
(1) 过程描述
2012年7月21日10时至22日02时,北京经历了自1963年8月8—9日极端降水事件以来最强的一次降水过程。7月21日08时至22日08时24 h全市20个国家级气象观测站平均雨量190 mm,其中房山区及门头沟和石景山区的部分地区降雨量超过250 mm(俞小鼎, 2012)。
此次降雨过程主要由中尺度对流系统MCS导致,北京地区的环境条件非常有利于暴雨发展。从探空资料分析,21日北京及周边在500 hPa存在明显的正涡度平流,北京CAPE值从08时的950 J·kg-1增加到14时的2100 J·kg-1,存在深厚湿层、强低空急流、较高的地面露点温度和异常大的可降水量(俞小鼎, 2012)。具体分析值如表 4所示。
(2) 时间序列检验分析
雷达定量估测的降雨量与自动站相比可从时间序列分析两者之间的差异,以房山自动站为例分析雷达检验和MRAWS的能力。总体上雷达和房山自动气象站测量降雨量的相关性较好,相关系数达0.73,但是均方根误差达16.73。通过分析可知大部分时次雷达和自动站测雨的误差较小,但在20和21时两个时次两者测雨量误差较大(图 7a)。以20时比较为例,两者观测差值超过表 1和表 2计算的7月阈值,此时如果仅使用雷达检验则会产生误判,而此时自动站观测的其他要素与降雨量的一致性较好(图 7b、7c、7d),因此以MRAWS检验则会给出正确的判断结果。通过这个个例说明,虽然雷达在大部分情况下定量检验自动站测量的降雨量的效果较好,但在某些情况下也会产生误判,而综合多要素检测降雨量的方法会避免由于使用单一方法造成的误判,提高了检验结果的正确率。
(3) 空间检验分析
天气雷达的特点是在短时间内能获得高时空分辨率的面雨量,能有效弥补自动站测雨的不足,因此在研究区域内使用雷达面雨量检验多个自动站测量降雨量的准确性也行之有效。雷达面雨量在空间上检验自动站测雨量的准确性可从两种设备观测差值上来分析,通过这种方法可以直观地发现存在问题的站点再结合自动站观测的其他要素综合分析测雨的准确性。以北京7 21过程中21日21时为例(图 8),雷达测量的小时降雨量与自动站相比在大部分情况下会存在低估且差值在合理范围内,但是也有个别站点差异较大,此时需结合自动站观测的其他要素采用综合判断才能给出正确的判断。
以54340站2012年10月31日观测为例,当日收到该站上传的雨量数据在13、17和18时分别为63.2、16.8和12.4 mm·h-1(图 9),后经过和该站观测人员通电得知该站并无降雨,3个时次的降雨观测值应均为0。那么仅依赖自动站资料仅能得出该站是否备降雨的条件,而雷达观测则能给出定量化的结果,进一步判定自动站观测小时降雨量的正确性。
本文在分析气温变化、风速变化、相对湿度、温度露点差、雷达和自动站降雨量差值的基础上,提出了针对自动站观测小时降雨量的多要素综合质量控制方法。通过历史数据统计出各个子方法的判断阈值,并对方法质控结果进行了比较和分析,在本研究的范围内可以得出以下的结论:
(1) 使用多种要素相结合以及综合评分的方法可以弥补使用单一资料方法带来的不足,有效地提高检测正确率,这也是MRAWS和MAWS的正确判别率明显高于MTS的原因。
(2) MRAWS优于MAWS的原因在于使用自动站资料的基础上引入了雷达测量的面雨量,弥补了仅使用自动站资料检验的不足。
(3) 在定量化分析雷达估测降水的基础上,证明雷达在定量检验自动站测量降雨方面具有一定的优势。
(4) MRAWS和MAWS方法仅适用于判别有无降水,对降水量值的正确性判断能力仍然存在不足。
本文提出的降雨量的多要素综合质量控制方法可根据雷达和自动站站点分布情况灵活地应用MAWS和MRAWS两种方法进行,其中MAWS的检验效果虽然略低于MRAWS,但是在自动站没有被雷达探测覆盖的区域可以起到重要作用。
本方法不仅可以应用于国家级自动站的降雨量结果检验,而且也可以应用于区域自动站,但是在区域自动站的应用还需进一步研究。原因主要包括两个方面:(1) 区域自动站观测要素不全、经纬度信息不准等原因会影响检验的结果;(2) 区域自动站观测数据真实性的核查比较困难,给质量控制结果的验证带来较大困难。
李爱贞, 刘厚凤, 2004. 气象学与气候学基础[M]. 北京: 气象出版社, 95-103.
|
李柏, 俞小鼎, 2011. 天气雷达及其应用[M]. 北京: 气象出版社, 359.
|
李亚丽, 任芝花, 陈高峰, 等, 2015. 自动与人工观测气温差异偏大的原因及影响分析——以143个国家基准站为例[J]. 气象, 41(8): 1007-1016. DOI:10.7519/j.issn.1000-0526.2015.08.010 |
李雁, 张乐坚, 梁海河, 等, 2013. 天气雷达与地面自动站降水观测一致性校验分析[J]. 气象科技, 41(3): 436-442. |
任芝花, 张志富, 孙超, 等, 2015. 全国自动气象站实时观测资料三级质量控制系统研制[J]. 气象, 41(10): 1268-1277. DOI:10.7519/j.issn.1000-0526.2015.10.010 |
任芝花, 赵平, 张强, 等, 2010. 适用于全国自动站小时降水资料的质量控制方法[J]. 气象, 36(7): 123-132. DOI:10.7519/j.issn.1000-0526.2010.07.019 |
魏凤英, 2007. 现代气候统计诊断与预测技术[M]. 北京: 气象出版社, 296.
|
俞小鼎, 2012. 2012年7月21日北京特大暴雨成因[J]. 气象, 38(11): 1313-1329. |
俞小鼎, 姚秀萍, 熊廷南, 2006. 多普勒天气雷达原理与业务应用[M]. 北京: 气象出版社, 314pp.
|
Doviak R J, Zrnic ' D S.2006.Doppler Radar and Weather Observations(Second Edition) Salt Lake City: Academic press, Dover unabridged republication, 562.
|
Gonázlez-Rouco J F, Jiménez J L, Quesada V, et al, 2000. Quality control and homogeneity of precipitation data in the southwest of europe[J]. J Climate, 14: 964-978. |
Wilks D S, 1995. Statistical Method in the Atmospheric Sciences:An Introduction[M].
Salt Lake City: Academic Press, 467.
|
Xu X Y, Howard K, Zhang J, 2008. An automated Radar Technique for the identification of tropical precipitation[J]. J Hydrometeor, 9: 885-902. DOI:10.1175/2007JHM954.1 |