快速检索
  气象   2021, Vol. 47 Issue (9): 1113-1121.  DOI: 10.7519/j.issn.1000-0526.2021.09.007

论文

引用本文 [复制中英文]

温华洋, 朱华亮, 马文周, 等, 2021. 基于Bayes判别法的结冰现象资料序列订正[J]. 气象, 47(9): 1113-1121. DOI: 10.7519/j.issn.1000-0526.2021.09.007.
[复制中文]
WEN Huayang, ZHU Hualiang, MA Wenzhou, et al, 2021. Data Sequence Correction of Icing Weather Phenomena Based on Bayes Discriminant Method[J]. Meteorological Monthly, 47(9): 1113-1121. DOI: 10.7519/j.issn.1000-0526.2021.09.007.
[复制英文]

资助项目

国家自然科学基金项目(41805023)和安徽省气象局研究性业务科技攻关项目(YJG202003)共同资助

第一作者

温华洋,主要从事气象数据产品研发.E-mail:wenhy12@163.com

通信作者

朱华亮,主要从事气象资料分析与评估.E-mail:hualiangzhu@126.com.

文章历史

2020年5月8日收稿
2021年7月16日收修定稿
基于Bayes判别法的结冰现象资料序列订正
温华洋 1, 朱华亮 1, 马文周 2, 邱康俊 1, 张苗苗 1, 刘壮 2    
1. 安徽省气象信息中心,合肥 230031
2. 合肥工业大学,合肥 230009
摘要:针对安徽省81个国家级地面气象站1961—2018年结冰现象资料序列,采用要素一致性、内部一致性、空间一致性等方法进行数据质量控制,基于质量控制后的正常年份数据进行Bayes判别模型训练,应用训练所得模型完成异常年份结冰数据的订正。结果表明:安徽省共有38个台站累计84年的年结冰日数质量控制检查异常,年结冰日数异常年份主要集中在1961—1970、1988—1999和2015—2017年,造成年结冰日数异常的原因有部分台站历史观测任务简化、气象台站分类调整以及地面气象观测业务改革等。利用Bayes判别法构建了多个结冰现象判别模型,经检验发现,模型1和模型3具有较高的判识正确率、命中率、TS评分以及较低的误警率。考虑计算的简便性,选用模型1对异常年份结冰数据进行逐日订正。通过六安站、太和站和无为站异常年份结冰现象订正结果对比发现,基于Bayes判别法的结冰现象判别模型,对不同时间段内、不同原因造成的结冰现象观测记录异常的订正均较为合理,订正后的年结冰日数变化趋势更符合实际情况,表明采用Bayes判别模型订正结冰现象是合理、可行的。
关键词结冰现象    序列订正    Bayes判别法    
Data Sequence Correction of Icing Weather Phenomena Based on Bayes Discriminant Method
WEN Huayang1, ZHU Hualiang1, MA Wenzhou2, QIU Kangjun1, ZHANG Miaomiao1, LIU Zhuang2    
1. Anhui Meteorological Information Centre, Hefei 230031;
2. Hefei University of Technology, Hefei 230009
Abstract: Using the methods of element consistency, internal consistency and spatial consistency, the data qualities of 81 national surface meteorological stations in Anhui Province from 1961 to 2018 are controlled. The Bayes discriminant model is trained based on the normal year data after quality control, and the icing data of abnormal year are corrected by the model. The results show that total 84 years' annual icing days from 38 stations in Anhui Province are abnormal, mainly concentrated in 1961-1970, 1988-1999 and 2015-2017, and fail to pass the quality control. The main reasons for these phenomena are the simplification of historical observation tasks of some stations, the adjustment of meteorological station classification, the reform of ground meteorological observation operation and so on. Then, by using the Bayes discriminant method, several discrimination models of icing weather phenomena are constructed. After verification, it is found that Model 1 and Model 3 have higher recognition accuracy, hit rate and TS score but lower false alarm rate. Considering the simplicity of calculation, Model 1 is selected to correct the icing data of abnormal years day by day. In addition, through the comparison of the icing weather phenomena correction results of Lu'an, Taihe and Wuwei Stations in abnormal years, we find that the model based on Bayes discriminant method is more reasonable for the correction of the icing weather phenomena caused by different reasons in different time periods, and the variation trend of annual icing days after correction is more in line with the actual situation, which shows that the Bayes discrimination model is reasonable and feasible to correct the icing weather phenomena.
Key words: icing weather phenomenon    sequence correction    Bayes discriminant method    
引言

结冰(又称冻结)指露天水面冻结成冰,包括器皿中的水冻结成冰,是日常生活中比较常见的自然现象,但其通常与低温冷害相伴随,对人类的生产生活、动植物的生长有较大的影响(中国气象局,2003唐熠等,2019刘洪兰等,2014马树庆等,2015; 李刚等,2020)。如在冬季的雨雪天气,高速公路、机场跑道上会出现积雪或结冰现象,由此引发的交通事故、交通延误等,已成为社会各界广泛关注的热点问题(Wang et al,2008丁国香等,2018蒲晓虎等,2014)。因此,气象部门对结冰现象的监测和预报非常重视,高质量、长序列的结冰资料有利于气候变化分析、农业气象和道路交通的预报与服务,也是开展有效灾害预防、应急救援等活动的科学依据(张志富等,2015张庆奎等,2020舒斯等,2019白永清等,2016Toms et al,2017)。

从20世纪50年代起,我国部分气象站就开始记录结冰现象,至今已形成了约60年的结冰现象观测资料,这些观测资料在农业、交通等领域的气象服务中发挥着重要作用,但同样存在着部分台站因历史观测任务简化、观测方式多次调整等诸多原因造成的数据质量不高的问题。余予等(2018)研究发现1954—1979年全国共有662个台站累计6 328年实际未观测和记录结冰现象,1981年前有839个台站累计1 453年存在明显漏记结冰现象情况。如果直接使用这些原始观测资料而不进行有效地质量控制,对于结冰现象长期变化趋势分析等会得到不同的甚至相反的结论。因此,在使用结冰现象观测资料前需进行严格的质量控制和合理的数据订正。目前,国内外主要基于界限值、内部一致性和人工审核等方式对结冰现象观测数据进行检查(范邵华等,2018任芝花等,20072015廖捷和周自江,2018江益等,2018刘小宁和任芝花,2005陶士伟等,2009闵锦忠等,2018),质量控制方法较为简单,如在历史资料的数字化过程中,仅对数据的完整性、规范性进行了检查,对出现的空白记录或者缺测记录无法进一步确认处理(范邵华等,2018);任芝花等(2015)设计的“台站-省级-国家级”三级质量控制只能对明显错误的数据进行缺测处理,无法确认某日是否出现结冰现象。在结冰现象观测数据订正方面,国内外相关研究较少,采用的线性回归法(余予等,2018)也仅能完成对年(或月)结冰日数的插补,较难认定某天是否发生结冰现象。为此,本文结合气温、地表温度等气象要素观测值对安徽省81个国家级地面气象站结冰现象观测资料进行了严格的质量控制,采用Bayes判别法构建了日结冰现象判别模型,并探讨了判别模型对结冰现象资料序列的逐日订正效果,旨在通过质量控制和数据订正形成高质量、长序列的结冰现象资料序列,为结冰现象的气候变化分析等提供科学依据。

1 资料与方法 1.1 资料与处理

本研究使用的资料包括安徽省81个国家级地面气象站1961—2018年的日结冰现象观测资料(当日是否出现)、日最低气温(单位:℃)、日最低地表温度(单位:℃),源自对应站点的地面气象月报表A文件。根据日最低气温和日最低地表温度观测值,对日结冰现象是否出现的资料序列进行初步质量控制。若某日出现结冰现象,且日最低气温和日最低地表温度均大于10℃,则判定该日的结冰现象记录错误,将该日订正为无结冰现象;如果日最低气温(或日最低地表温度)缺测,则在该日定时气温(或地表温度)中取最小值进行替代。依据《地面气象观测规范》(中国气象局,2003)统计得到安徽省81个国家级地面气象站1961—2018年的年结冰日数序列。

1.2 研究方法

为了更好地完成结冰现象资料序列的订正,采用要素一致性、内部一致性、空间一致性等方法对年结冰日数序列进行质量控制,方法和步骤如下:

第一步进行要素一致性检查。针对各站计算年结冰日数序列与年最低气温 < 0℃日数序列间的相关系数(R)。选取相关系数R>0.9且通过0.05的显著性水平检验的台站,利用这些台站的年结冰日数(y)和年最低气温 < 0℃日数(x),求取两者间线性拟合公式。利用线性拟合公式估算各站每年的结冰日数,若某年观测值比估算值偏低50%,则认为该年结冰现象数据异常,对其进行标记。

第二步进行内部一致性检查。基于完成要素一致性检查后的正确结冰现象数据,计算各站年结冰日数的均值(μ)和标准差(σ),若某年结冰日数位于区间[μ-3σμ+3σ]之外,则认为该年结冰数据异常,对其进行标记。

第三步进行空间一致性检查。基于内部一致性检查后的正确结冰现象数据,为待检验站点(以下简称待检站)构建参考序列,参考站选取的步骤与标准为:(1)与待检站的海拔高度差不超过200 m,地理环境相似;(2)与待检站的年平均气温序列相关系数R>0.6且通过0.05的显著性水平检验;(3)与待检站的直线距离 < 100 km,且距离最近的5个气象站。若选取的参考站数量不足5个,则以实际数量计算,若参考站数量为0个,则不进行空间一致性检查。计算待检站年结冰日数相对参考站平均年结冰日数的偏差,若某年的相对偏差超过50%,则认为该年结冰数据异常,对其进行标记。

对经质量控制后的正常年份数据进行Bayes判别模型训练,应用所得的模型对异常年份结冰现象数据进行订正,其中Bayes判别模型训练方法和步骤(王斌会,2011华连生等,2015)如下:

(1) 计算训练样本集中日结冰现象不发生和发生的概率分别为P0P1

(2) 假设某日的相关气象要素观测值X =(x1x2, …, xn)′,其中x1, x2, …, xn表示日最低气温、日最低地表温度等。根据训练样本集计算该日结冰现象不发生和发生情况下观测到相应气象要素值X的概率P(X /Yi), i=0, 1,其中Y0代表日结冰现象不发生,Y1代表日结冰现象发生。

(3) 根据Bayes定理,计算在相应气象要素观测值X条件下该日结冰现象不发生或发生的概率P(Yi/ X):

$ \begin{array}{l} P\left({{Y_i}/{\boldsymbol{X}}} \right) = \frac{{P\left({{\boldsymbol{X}}/{Y_i}} \right){P_i}}}{{P\left({{\boldsymbol{X}}/{Y_i}} \right){P_0} + P\left({{\boldsymbol{X}}/{Y_1}} \right){P_1}}}\\ \;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;i = 0, 1 \end{array} $ (1)

$ P\left({{Y_0}/{\boldsymbol{X}}} \right) = \mathop {\max }\limits_{i \in \left\{ {0, 1} \right\}} P\left({{Y_i}/{\boldsymbol{X}}} \right) $,即结冰现象不发生的概率大于发生的概率,则认为该日无结冰现象;否则,认为该日有结冰现象。假设结冰未发生条件下气象要素的协方差矩阵和结冰发生条件下气象要素的协方差矩阵相同,且都服从多元正态分布N(μi, Σ),则有:

$ \left\{ \begin{array}{l} P\left({{\boldsymbol{X}}/{Y_0}} \right) = {\left({2\pi } \right)^{ - n/2}}{\left| {\mathit{\pmb{\Sigma}}} \right|^{ - 1/2}} \cdot \\ \;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\exp \left[ { - \frac{1}{2}\left({{\boldsymbol{X}} - {{\boldsymbol{\mu}} _0}} \right)'{{\mathit{\pmb{\Sigma}}} ^{ - 1}}\left({{\boldsymbol{X}} - {{\boldsymbol{\mu}} _0}} \right)} \right]\\ P\left({{\boldsymbol{X}}/{Y_1}} \right) = {\left({2\pi } \right)^{ - n/2}}{\left| {\mathit{\pmb{\Sigma}}} \right|^{ - 1/2}} \cdot \\ \;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\exp \left[ { - \frac{1}{2}\left({{\boldsymbol{X}} - {{\boldsymbol{\mu}} _1}} \right)'{{\mathit{\pmb{\Sigma}}} ^{ - 1}}\left({{\boldsymbol{X}} - {{\boldsymbol{\mu}} _1}} \right)} \right] \end{array} \right. $ (2)

式中: μi=(μi1, μi2, …, μin)′,i=0, 1;其中μi1, μi2, …, μin表示第i个总体中各变量的均值。协方差矩阵Σ=(σjl)n×n,协方差逆矩阵Σ-1=(σjl)n×n,其中σjlσjl分别表示协方差矩阵及其逆矩阵中的第j行第l列元素,j=1, 2, …, n, l=1, 2, …, n。因为

$ \begin{array}{l} \mathop {\max }\limits_{i \in \left\{ {0, 1} \right\}} P\left({{Y_i}/{\boldsymbol{X}}} \right) \Leftrightarrow \mathop {\max }\limits_{i \in \left\{ {0, 1} \right\}} \left[ {P\left({{\boldsymbol{X}}/{Y_i}} \right){P_i}} \right]\\ \;\;\;\;\;\;\; \Leftrightarrow \mathop {\max }\limits_{i \in \left\{ {0, 1} \right\}} \ln \left[ {P\left({{\boldsymbol{X}}/{Y_i}} \right){P_i}} \right] \end{array} $

式中“⇔”表示等价的意思,则有:

$ \begin{array}{l} \ln \left[ {P\left({{\boldsymbol{X}}/{Y_i}} \right){P_i}} \right] = \ln {P_i} - \frac{n}{2}\ln \left({2\pi } \right) - \\ \;\;\;\;\;\;\;\;\;\;\frac{1}{2}\ln \left| {\mathit{\pmb{\Sigma}}} \right| - \frac{1}{2}{\boldsymbol{X}}'{{\mathit{\pmb{\Sigma}}} ^{ - 1}}{\boldsymbol{X}} - \\ \;\;\;\;\;\;\;\;\;\;\frac{1}{2}{{\boldsymbol{\mu}} _i}'{\Sigma ^{ - 1}}{{\boldsymbol{\mu}} _i} + {\boldsymbol{X}}'{{\mathit{\pmb{\Sigma}}} ^{ - 1}}{{\boldsymbol{\mu}} _i} \end{array} $ (3)

略去式(3)中与i无关的项,则可写为如下线性判别函数:

$ \left\{ \begin{array}{l} {Y_0}\ln {P_0} + {a_{00}} + {a_{01}}{x_1} + \cdots + {a_{0n}}{x_n}\\ {Y_1}{\rm{ = }}\ln {P_1} + {a_{10}} + {a_{11}}{x_1} + \cdots + {a_{1n}}{x_n} \end{array} \right. $ (4)

式中:

$ \begin{array}{l} {a_{i0}} = - \frac{1}{2}{{\boldsymbol{\mu}} _i}'{{\mathit{\pmb{\Sigma}}} ^{ - 1}}{{\boldsymbol{\mu}} _i}\\ \;\;\;{a_{ij}} = \sum\limits_{l = 1}^n {{\sigma ^{jl}}{\mu _{il}}} \\ \;\;\;\;\;i = 0, 1, j = 1, 2, \cdots, n \end{array} $

Y0>Y1,认为该日无结冰现象;反之,认为该日有结冰现象。根据每日相关气象要素的观测值(日最低气温、日最低地表温度等),利用式(4)可以完成逐日结冰现象的订正。

1.3 Bayes判识模型评价指标

为检验基于Bayes判别法建立的结冰判别模型判识效果,采用准确率(PC)、命中率(POD)、误警率(FAR)和TS评分(TS)等指标进行评估,具体计算公式如下:

$ PC = \frac{{TP + TN}}{{TN + FN + FP + TP}} \times 100\% $ (5)
$ POD = \frac{{TP}}{{FN + TP}} \times 100\% $ (6)
$ FAR = \frac{{TP}}{{FN + TP}} \times 100\% $ (7)
$ TS = \frac{{TP}}{{FP + FN + TP}} \times 100\% $ (8)

式中:TN表示人工观测和模型判识都无结冰现象的日数,TP表示人工观测和模型判识都有结冰现象的日数,FN表示人工观测有结冰现象但模型判识无结冰现象的日数,FP表示人工观测无结冰现象但模型判识有结冰现象的日数。

2 数据质量控制检查结果分析

计算各台站年结冰日数与年最低气温 < 0℃日数间的相关系数,其中共有39个台站的相关系数R>0.9,且通过0.05的显著性水平检验。选用这39个台站的数据计算年结冰日数(y)和年最低气温 < 0℃日数(x)间的线性拟合公式为:

$ \hat y = 3.55 + 0.965x $ (9)

式中ŷ表示年结冰日数估算值。式(9)及其回归系数均通过0.05的显著性水平检验,利用建模数据进行回算发现,估算值与观测值之间的平均绝对偏差为4.2 d,均方根误差为5.5 d,两者误差较小,表明式(9)对年结冰日数的拟合效果较好,故可采用该式对各站的年结冰日数进行要素一致性检查。通过式(9)的要素一致性检查并辅以人工校对发现,安徽省共有23个台站累计52年的年结冰日数异常。在内部一致性检查方面,检查结果显示共有2个台站累计2年的年结冰日数异常。在空间一致性检查方面,天柱山、岳西、九华山和黄山等4个台站因海拔高度较高,没有符合参考站选取标准的相邻站,未进行空间一致性检查,对其余台站进行空间一致性检查并辅以人工校对发现,安徽省共有17个台站累计30年的年结冰日数异常。质量控制结果表明,1961—2018年安徽省共有38个台站累计84年的年结冰日数异常。

图 1给出了1961—2018年结冰日数质量控制异常台站数逐年分布,从图中可以看出,年结冰日数异常年份主要集中在1961—1970、1988—1999和2015—2017年。这主要是由于20世纪60年代早期对结冰现象的观测要求较为简单(中国气象局,1961),导致这类台站的结冰现象记录异常偏少,甚至为零。随着《地面气象观测规范》的修改和逐步完善(宁惠芳等,2014),1970年之后这一问题得到了明显地扭转。1988年中国气象局制定实施的《地基气象探测系统发展方案》,将部分国家级地面气象观测站(如太和站、怀远站和怀宁站)划分为观测辅助站(吴增祥,2006),对气压、天气现象等气象要素不做观测要求,造成记录的结冰现象显著偏少或无记录,1999年后观测辅助站重新归类为国家一般气象站(以下简称一般站),所以1988—1999年有3~4个台站的年结冰日数出现异常。2014年中国气象局实施《地面气象观测业务改革方案》(中国气象局综合观测司,2013),将国家基准气候站(以下简称基准站)和国家基本气象站(以下简称基本站)夜间天气现象连续观测(20时至次日08时)调整为4次整点(20、23、02、05时)观测,同时取消一般站夜间值守任务,这就造成夜间出现短时间结冰现象而漏记的情况,2018年安徽省加强了对月报表A文件中结冰现象的人工质量控制工作,因此,2015—2017年出现较多台站年结冰日数异常偏少现象,而2018年未见数据异常现象。图 2给出了安徽省年结冰日数检查异常的台站分布,从图中可以看出,在全省年结冰日数异常的38个台站中,基准站和基本站共有10个站累计13年的年结冰日数异常,一般站共有28个台站累计69年的年结冰日数异常,异常站点及累计异常年数中一般站的占比都比较大,这与一般站观测方式的多次调整有关。在空间分布上,年结冰日数记录异常并无明显特征。

图 1 1961—2018年安徽省年结冰日数异常台站数逐年分布 Fig. 1 Distribution of stations with abnormal annual icing days in Anhui Province from 1961 to 2018

图 2 1961—2018年安徽省各台站累计异常年数分布(单位:a) Fig. 2 Distribution of cumulative abnormal years of stations in Anhui Province from 1961 to 2018 (unit: a)
3 结冰现象资料序列订正 3.1 Bayes判别模型建立

针对经过质量控制后的正确年份结冰现象数据,剔除日最低气温和日最低地表温度均大于10℃的日数据,得到较易发生结冰现象的日数据,共有数据1 203 734 d,随机选取80%作为模型训练数据集,剩余20%作为模型验证数据集。训练数据集中无结冰日数占比P0=0.66,有结冰日数占比P1=0.34。鉴于温度对结冰现象的影响,将日最低气温(Tmin)、日最低地表温度(Dmin)依次代入式(4)中建模,得到结冰现象判别模型1、模型2和模型3如下:

模型1(日最低气温判别模型):

$ \left\{ \begin{array}{l} {Y_0} = 0.6319 + 0.2726{T_{\min }}\\ {Y_1} = 0.5670 - 0.1496{T_{\min }} \end{array} \right.$ (10)

模型2(日最低地表温度判别模型):

$ \left\{ \begin{array}{l} {Y_0} = 1.1136 + 0.1546{D_{\min }}\\ {Y_1} = 0.3349 - 0.1965{D_{\min }} \end{array} \right. $ (11)

模型3(日最低气温和日最低地表温度判别模型):

$ \left\{ \begin{array}{l} {Y_0} = 23.5844 + 3.6126{T_{\min }} + 0.7133{D_{\min }}\\ {Y_1} = 18.3872 - 6.6013{T_{\min }} - 1.3021{D_{\min }} \end{array} \right. $ (12)

为考察模型1~模型3对结冰现象的判别能力,利用验证数据集对各模型进行检验,其中验证数据集中无结冰日为168 179 d,有结冰日为72 432 d,共计240 611 d。表 1给出了各模型的正确率、命中率、误警率、TS评分等检验评价指标,模型1和模型3具有较高的判识正确率、命中率和TS评分,且模型的误警率较低,模型2的判识效果不如模型1和模型3,表明可用模型1和模型3对日结冰现象进行判识,但两者判识效果差异不大,且模型1比模型3少一元变量,更便于计算,因此,选用模型1对质量控制检查异常年份结冰数据进行逐日订正。

表 1 基于验证数据集的各模型判别效果 Table 1 Discrimination effect of each model based on validation data set
3.2 基于Bayes判别模型的结冰序列订正

针对数据质量控制标记的结冰现象记录异常年份数据,利用模型1进行逐日判别。如果模型判别结果与人工记录结果不一致,则将该日结冰现象订正为模型判别结果;否则不进行订正。如果某日最低气温缺测,则在该日定时气温中取最小值进行替代。

通过上述方法对安徽省38个台站累计84年的异常年份数据进行订正,共订正了2 949 d的结冰现象记录,订正数据量占异常年份总数据量的9.5%,占比较少。基于订正后的结冰现象资料序列重新进行要素一致性、内部一致性、空间一致性等检查,发现仍有2个台站累计2年的年结冰日数异常(表 2)。从表 2中可以看出,望江站模型判别结冰日数相对参考站平均结冰日数明显偏少,导致该站2017年订正后的年结冰日数未通过空间一致性检验。经统计发现,人工记录结冰日数明显少于年最低气温 < 0℃日数和年最低地表温度 < -1℃日数,而模型判别结冰日数更接近于年最低气温 < 0℃日数和年最低地表温度 < -1℃日数,表明望江站2017年人工观测结冰现象的记录中存在漏记的可能。淮南站1999年人工记录结冰日数和模型判别结冰日数相对于参考站平均结冰日数都明显偏少,所以该年结冰日数也未通过空间一致性检验,但人工观测结冰日数、模型判别结冰日数和年最低气温 < 0℃日数三者间都比较接近,故认为当年结冰现象人工记录正常。总体而言,经Bayes判别模型订正后,38个台站累计84年的异常年份数据中有36个台站累计82年通过质量控制检查,虽有2个台站累计2年的年结冰日数未通过检验,但模型判别结果比较符合台站自身的实际情况,表明经Bayes判别模型订正后结冰现象数据质量得到明显提升。

表 2 异常站点年结冰日数的质量控制结果 Table 2 The quality control results of revised annual icing days at abnormal stations
3.3 订正结果对比

以六安站、太和站和无为站为例,考察Bayes判别模型对质量控制检查异常年份结冰现象的订正效果,并与参考序列进行对比,其中参考序列的构建选用通过质量控制的站点数据,具体参见空间一致性检验参考站选取的方法与步骤。六安站的年结冰日数异常年份出现在1967年和1968年,这两年人工观测的年结冰日数分别为23 d和8 d,利用模型1订正后的年结冰日数分别为69 d和56 d,模型订正值与人工观测值差异较大,但与参考序列的年结冰日数更为接近(图 3a)。在年结冰日数变化趋势上,订正序列的趋势与参考序列的趋势更为接近,且均为下降趋势,表明Bayes判别模型对六安站1967年和1968年的结冰现象订正效果较好。太和站在1988—1999年为观测辅助站,对结冰现象不做观测要求,造成1988—1999年的结冰现象未做记录,通过模型1订正后,1988—1999年订正序列平均年结冰日数为63.8 d,最低年结冰日数为42 d,最高年结冰日数为82 d,与参考序列的平均绝对差值为6.5 d,最大绝对差值为12.2 d,而1961—1987年年结冰日数原始序列与参考序列的平均绝对差值为5.6 d,最大绝对差值为15.4 d,2000—2018年年结冰日数原始序列与参考序列的平均绝对差值为7.1 d,最大绝对差值为12.4 d,表明1988—1999年年结冰日数订正序列与参考序列的误差在合理范围内。从变化趋势上看,订正序列的变化趋势与参考序列更接近(图 3b),且订正序列线性趋势线的拟合优度R2要明显大于原始序列趋势线的R2,表明利用订正序列得到的趋势线更可靠。总体看来,Bayes判别模型对太和站1988—1999年的结冰现象订正较为合理。图 3c给出了无为站订正前后1961—2018年年结冰日数序列,无为站2016年和2017年人工观测的结冰日数分别为12 d和8 d,相较于往年观测值和参考序列都明显偏少,订正后的结冰日数分别为26 d和21 d,与参考序列更为接近,也更符合序列变化趋势。

图 3 1961—2018年六安站(a)、太和站(b)和无为站(c)年结冰日数序列 Fig. 3 Annual icing days series of Lu'an Station (a), Taihe Station (b) and Wuwei Station (c) from 1961 to 2018

通过六安站、太和站和无为站异常年份结冰现象订正结果对比发现,基于Bayes判别法的结冰现象判别模型,对不同时间段、不同原因造成的典型的结冰观测记录异常的订正均较为合理,订正后的年结冰日数变化趋势更符合实际情况,表明采用Bayes判别模型订正结冰现象是合理、可行的。

4 结论与讨论

(1) 本研究采用要素一致性、内部一致性、空间一致性等方法对安徽省81个台站1961—2018年年结冰日数序列进行更细致的质量控制,与余予等(2018)中质量控制方法相比,本研究所采用的方法更为严格,主要体现在:①本研究内部一致性检查时采用3倍标准差,而余予等(2018)采用5倍标准差;②本研究采用了空间一致性检查,而余予等(2018)未进行空间一致性检查。

(2) 年结冰日数质量控制结果表明,安徽省共有38个台站累计84年的年结冰日数质量控制检查异常,年结冰日数异常年份主要集中在1961—1970、1988—1999和2015—2017年,造成年结冰日数异常的原因有部分台站历史观测任务简化、气象台站分类调整以及地面气象观测业务改革等。余予等(2018)对安徽省1981年之前的年结冰日数质量控制发现,共有1站累计1年未记录结冰现象,有8站存在1~2年的年结冰日数显著偏低。从图 1可以看出,本研究发现的1981年之前的年结冰日数异常站数和累计年数要明显多于余予等(2018)的质量控制结果,这也佐证了本研究质量控制标准比余予等(2018)的质量控制标准更为严格。

(3) 针对质量控制后的正确年份结冰现象数据集,采用Bayes判别法建立模型1、模型2和模型3。经检验发现,模型1和模型3各项评价指标均较好。考虑计算的简便性,选用模型1对质量控制检查异常年份结冰数据进行逐日订正。通过订正结果对比发现,基于Bayes判别法的结冰现象判别模型,对不同时间段内,不同原因造成的结冰现象观测记录异常的订正均较为合理,订正后的年结冰日数变化趋势更符合实际情况,表明采用Bayes判别模型订正结冰现象是合理、可行的。

(4) 本研究发现部分台站历史观测任务简化、气象台站分类调整、地面气象观测业务改革等引发了安徽省部分台站的年结冰日数异常问题,这些问题势必在全国其他地区同样存在,余予等(2018)仅对1981年前的年结冰日数进行质量控制,就发现全国1954—1979年共有662个台站累计6 328年实际未观测和记录结冰现象,1981年前有839个台站累计1 453年存在明显漏记结冰现象情况。因此,在使用全国结冰资料进行气候变化分析时,还需进行有效的质量控制和序列订正。本研究所用方法对全国范围内的结冰资料的质量控制和订正提供了一种参考,但其质量控制和订正效果还有待于进一步探讨。

参考文献
白永清, 陈城, 何明琼, 2016. 利用Logistic回归方法的高速桥(路)面结冰风险等级预警模型[J]. 气象科技, 44(2): 336-340. Bai Y Q, Chen C, He M Q, 2016. Warning model of risk degree for bridge/road surface icing of expressway based on Logistic regression[J]. Meteor Sci Technol, 44(2): 336-340 (in Chinese). DOI:10.3969/j.issn.1671-6345.2016.02.026
丁国香, 刘承晓, 周建平, 等, 2018. 气象条件对安徽高速公路运营的影响[J]. 干旱气象, 36(5): 858-863. Ding G X, Liu C X, Zhou J P, et al, 2018. Impact of meteorological conditions on expressway operation in Anhui Province[J]. J Arid Meteor, 36(5): 858-863 (in Chinese).
范邵华, 余予, 鞠晓慧, 等, 2018. 气象资料数字化进展及应用[J]. 气象科技进展, 8(1): 64-70, 78. Fan S H, Yu Y, Ju X H, et al, 2018. A review for the progesses and applications of historical meteorological data rescuing and digitizing over China[J]. Adv Meteor Sci Technol, 8(1): 64-70, 78 (in Chinese). DOI:10.3969/j.issn.2095-1973.2018.01.007
华连生, 温华洋, 朱华亮, 等, 2015. 基于Bayes判别法的霜生自动化观测模型探讨[J]. 气象, 41(8): 964-969. Hua L S, Wen H Y, Zhu H L, et al, 2015. Automated observation model for frost based on Bayes discriminant method[J]. Meteor Mon, 41(8): 964-969 (in Chinese).
江益, 王立俊, 羊清雯, 等, 2018. 南海区域站气象资料质量控制方法改进[J]. 气象科技, 46(3): 474-478, 496. Jiang Y, Wang L J, Yang Q W, et al, 2018. Improvement of quality control method for real time meteorological data from regional automatic stations on South China Sea[J]. Meteor Sci Technol, 46(3): 474-478, 496 (in Chinese).
李刚, 马继望, 梁湘三, 2020. 2008年1月中国南方低温雨雪期间异常阻塞高压事件的多尺度动力过程分析[J]. 气象学报, 78(1): 18-32. Li G, Ma J W, Liang X S, 2020. A study of the multiscale dynamical processes underlying the blocking high that caused the January 2008 freezing rain and snow storm in southern China[J]. Acta Meteor Sin, 78(1): 18-32 (in Chinese).
廖捷, 周自江, 2018. 全球常规气象观测资料质量控制研究进展与展望[J]. 气象科技进展, 8(1): 56-63. Liao J, Zhou Z J, 2018. Quality control of the global conventional meteorological observations: progresses and prospects[J]. Adv Meteor Sci Technol, 8(1): 56-63 (in Chinese). DOI:10.3969/j.issn.2095-1973.2018.01.006
刘洪兰, 张俊国, 阙龙凯, 等, 2014. 基于BP神经网络的张掖国家湿地公园水域结冰厚度预报模型[J]. 高原气象, 33(3): 832-837. Liu H L, Zhang J G, Que L K, et al, 2014. Forecasting model for ice thickness in Zhangye National Wetland Park watershed based on BP neural network[J]. Plateau Meteor, 33(3): 832-837 (in Chinese).
刘小宁, 任芝花, 2005. 地面气象资料质量控制方法研究概述[J]. 气象科技, 33(3): 199-203. Liu X N, Ren Z H, 2005. Progress in quality control of surface meteorological data[J]. Meteor Sci Technol, 33(3): 199-203 (in Chinese). DOI:10.3969/j.issn.1671-6345.2005.03.002
马树庆, 袭祝香, 马力文, 等, 2015. 北方水稻低温冷害指标持续适用性检验与比较[J]. 气象, 41(6): 778-785. Ma S Q, Xi Z X, Ma L W, et al, 2015. Test and comparison of sustainable suitability of meteorological indicators for rice cold damages in the North of China[J]. Meteor Mon, 41(6): 778-785 (in Chinese).
闵锦忠, 王晨珏, 贾瑞怡, 2018. 苏皖地面自动站资料的质量控制及结果分析[J]. 大气科学学报, 41(5): 637-646. Min J Z, Wang C J, Jia R Y, 2018. Quality control and result analysis for surface AWS data in Jiangsu and Anhui Provinces[J]. Trans Atmos Sci, 41(5): 637-646 (in Chinese).
宁惠芳, 张志富, 范邵华, 2014. 浅析《地面气象观测规范》的演变及对资料质量控制的影响[J]. 青海气象, (3): 53-56. Ning H F, Zhang Z F, Fan S H, 2014. Analysis of the evolution of "ground meteorological observation standard" and its influence on data quality control[J]. J Qinghai Meteor, (3): 53-56 (in Chinese).
蒲晓虎, 张春波, 马舒庆, 等, 2014. 地面气象观测中结冰自动化观测的研究[J]. 气象, 40(2): 234-237. Pu X H, Zhang C B, Ma S Q, et al, 2014. Research on icing automation observation in ground meteorological observation[J]. Meteor Mon, 40(2): 234-237 (in Chinese).
任芝花, 熊安元, 邹凤玲, 2007. 中国地面月气候资料质量控制方法的研究[J]. 应用气象学报, 18(4): 516-523. Ren Z H, Xiong A Y, Zou F L, 2007. The quality control of surface monthly climate data in China[J]. J Appl Meteor Sci, 18(4): 516-523 (in Chinese). DOI:10.3969/j.issn.1001-7313.2007.04.012
任芝花, 张志富, 孙超, 等, 2015. 全国自动气象站实时观测资料三级质量控制系统研制[J]. 气象, 41(10): 1268-1277. Ren Z H, Zhang Z F, Sun C, et al, 2015. Development of three-step quality control system of real-time observation data from AWS in China[J]. Meteor Mon, 41(10): 1268-1277 (in Chinese). DOI:10.7519/j.issn.1000-0526.2015.10.010
舒斯, 熊守权, 陈英英, 等, 2019. 湖北省高速公路道路结冰预警模型[J]. 气象, 45(11): 1589-1599. Shu S, Xiong S Q, Chen Y Y, et al, 2019. Warning model of road surface icing of expressway in Hubei Province[J]. Meteor Mon, 45(11): 1589-1599 (in Chinese). DOI:10.7519/j.issn.1000-0526.2019.11.009
唐熠, 周秀华, 郑传新, 等, 2019. 广西重大低温雨雪冰冻过程500 hPa信号场异常特征分析[J]. 气象, 45(10): 1446-1456. Tang Y, Zhou X H, Zheng C X, et al, 2019. Analysis of abnormal characteristics at 500 hPa signal field in major cryogenic freezing rain and snow processes in Guangxi[J]. Meteor Mon, 45(10): 1446-1456 (in Chinese). DOI:10.7519/j.issn.1000-0526.2019.10.011
陶士伟, 仲跻芹, 徐枝芳, 等, 2009. 地面自动站资料质量控制方案及应用[J]. 高原气象, 28(5): 1202-1209. Tao S W, Zhong J Q, Xu Z F, et al, 2009. Quality control schemes and its application to automatic surface weather observation system[J]. Plateau Meteor, 28(5): 1202-1209 (in Chinese).
王斌会, 2011. 多元统计分析及R语言建模: 第2版[M]. 广州: 暨南大学出版社: 113-153. Wang B H, 2011. Multivariate Statistical Analysis and Modeling for R Language: 2nd ed.[M]. Guangzhou: Jinan University Press: 113-153 (in Chinese).
吴增祥, 2006. 中国地面气象台站(1950—2004)沿革情况概述[C]//中国气象学会2006年年会"气象史志研究进展"分会场论文集. 成都: 中国气象学会: 87-97. Wu Z X, 2006. An overview of the evolution of China's surface meteorological stations(1950-2004)[C]//Proceedings of the "Research Progress of Meteorological History" branch of the 2006 Annual Meeting of China Meteorological Society. Chengdu: China Meteorological Society: 87-97(in Chinese).
余予, 任芝花, 孟晓艳, 2018. 中国结冰现象序列的建立及气候变化分析[J]. 高原气象, 37(2): 553-559. Yu Y, Ren Z H, Meng X Y, 2018. Construction and climate variation analysis of icing weather phenomenon series over China[J]. Plateau Meteor, 37(2): 553-559 (in Chinese).
张庆奎, 项阳, 吉振明, 等, 2020. 近55年安徽省结冰现象气候特征及趋势分析[J]. 自然灾害学报, 29(6): 218-226. Zhang Q K, Xiang Y, Ji Z M, et al, 2020. Analysis of climatic characteristics and trends for icing weather phenomenon in Anhui Province in recent 55 years[J]. J Nat Dis, 29(6): 218-226 (in Chinese).
张志富, 希爽, 余予, 等, 2015. 1961—2012年中国5类主要冰冻天气的气候及变化特征[J]. 冰川冻土, 37(6): 1435-1442. Zhang Z F, Xi S, Yu Y, et al, 2015. Climatic characteristics and variations of the gelivation weathers in China during 1961-2011[J]. J Glaciol Geocryol, 37(6): 1435-1442 (in Chinese).
中国气象局, 1961. 地面气象观测规范[M]. 北京: 气象出版社: 83-98. China Meteorological Administration, 1961. Specification for Ground Meteorological Observation[M]. Beijing: China Meteorological Press: 83-98 (in Chinese).
中国气象局, 2003. 地面气象观测规范[M]. 北京: 气象出版社: 21-27. China Meteorological Administration, 2003. Specification for Ground Meteorological Observation[M]. Beijing: China Meteorological Press: 21-27 (in Chinese).
中国气象局综合观测司, 2013. (2013-12-05) [2014-01-08]. 关于做好全国地面气象观测业务调整工作的通知: 气测函[2013]321号[A/OL]. https://wenku.baidu.com/view/55b1110bf01-dc281e53af0c6.html. Department of Integrated Observations, China Meteorological Administration, 2013. (2013-12-05) [2014-01-08]. Notice on the adjustment of national surface meteorological observation[A/OL]. https://wenku.baidu.com/view/55b1110bf01dc281e53af0c6.html (in Chinese).
Toms B A, Basara J B, Hong Y, 2017. Usage of existing meteorological data networks for parameterized road ice formation modeling[J]. J Appl Meteor Climatol, 56(7): 1959-1976. DOI:10.1175/JAMC-D-16-0199.1
Wang Y G, Zhou Z J, Zhang Q, et al, 2008. Main meteorological disasters and their impacts on the economic and societal developments in China[J]. Int J Risk Assess Manage, 8(4): 384-394. DOI:10.1504/IJRAM.2008.019024