快速检索
  气象   2012, Vol. 38 Issue (12): 1515-1522.  

研究论文

引用本文 [复制中英文]

冯民学, 周俊驰, 曾明剑, 等, 2012. 基于对流参数的洋口港地区雷暴预报方法研究[J]. 气象, 38(12): 1515-1522. DOI: .
[复制中文]
FENG Minxue, ZHOU Junchi, ZENG Mingjian, et al, 2012. Research on Lightning Forecast at Yangkou Harbor Based on Convective Indexes[J]. Meteorological Monthly, 38(12): 1515-1522. DOI: .
[复制英文]

资助项目

江苏省“科技支撑计划——社会发展”项目(BS20025) 资助

第一作者

冯民学,主要从事雷电预警及防护研究.Email:fengminxue@tom.com

文章历史

2011年12月19日收稿
2012年8月27日收修定稿
基于对流参数的洋口港地区雷暴预报方法研究
冯民学 1, 周俊驰 1, 曾明剑 2, 焦雪 1, 王洪生 1, 许小川 1, 葛黎黎 3, 庄智福 4    
1. 江苏省防雷中心,南京 210009
2. 江苏省气象台,南京 210008
3. 南京信息工程大学,南京 210044
4. 江苏省气象信息中心 南京 210008
摘要:文章分析了洋口港地区2001—2009年4—9月1645个样本22种对流参数与雷暴事件的相关性以及这些参数的统计特征。结果表明,各对流参数月际分布差异较大,各参数与雷暴事件相关系数也不同。因而选择沙氏指数SI、全总指数TT、杰弗逊指数JI、抬升凝结高度温度tcl_t、上下层温差dt_58、大气可降水量pw、风暴强度指数SSI等7个对于雷暴活动具有较好相关性的因子,并考虑到4—9月月际分布差异,使用不同月份pwSITTJI的不同阈值作为排空因子,不同月份SSItcl_tdt_58的不同阈值作为预报因子,使用二级逻辑回归法建立排空方程和预报方程,同时对所建立各月预报方程进行了检验和拟合结果分析,并对2010年4—9月样本进行试报,预报效果较好。
关键词对流参数    相关系数    月际分布    二级逻辑回归预报方程    雷暴    
Research on Lightning Forecast at Yangkou Harbor Based on Convective Indexes
FENG Minxue1, ZHOU Junchi1, ZENG Mingjian2, JIAO Xue1, WANG Hongsheng1, XU Xiaochuan1, GE Lili3, ZHUANG Zhifu4    
1. Jiangsu Lightning Protection Centre, Nanjing 210009;
2. Jiangsu Meteorological Observatory, Nanjing 210008;
3. Nanjing University of Information Science and Technology, Nanjing 210044;
4. Jiangsu Meteorological Information Centre, Nanjing 210008
Abstract: This paper analyzed statistical characteristics of 22 convective indexes in the 1645 samples from April to September, 2001-2009 at Yangkou Harbor and their correlation with lightning activities. The results have shown the monthly variations and different coefficients of the indexes, and then the elimination and forecasting equations were set up by means of bi-level logistic regression using the multiple thresholds of indexes pw, SI, TT, JI for elimination and those of SSI, tcl_t, dt_58 for prediction with consideration of monthly diversity of each index which is in close correlation with lightning activities. The fitting test has confirmed good forecasting effects of the equations above.
Key words: convective indexes    correlation coefficients    monthly variation    bi-level logistic regression equations    thunderstorm    
引言

洋口港位于江苏省南通市如东县东部沿海,是中国沿海中部唯一能建30万吨级的天然深水良港,它的开发建设作为江苏沿海开发的核心工程,已经列入国家战略布局,对整个中国沿海开发和能源安全具有重要战略意义。该港口地处江淮下游,是暖温带与亚热带过渡地带,冷暖气流频繁交汇,气候复杂多变,雷暴活动和雷电灾害频繁,加强对该地区雷暴天气的分析与研究,提高对洋口港地区雷暴活动的预报能力,具有重大意义。

雷暴云的发展与热气团在不稳定环境中的对流抬升有关[1-2],所以雷暴事件与大气的不稳定因子之间必然有一定关系。陈艳等[3]采用中尺度数值模式模拟一次暴雨过程后指出,对流有效位能、风暴相对螺旋度等参数对强对流过程的发生发展有较好的指示作用。赵秀英等[4]和高守亭等[5]也分别把与动力、热力都相关的风暴强度指数、里查森指数用于强对流发生机制的研究。张翠华等[6]研究发现, 中层(700~400 hPa)平均相对湿度与地闪活动有较好的相关性。郑栋等[7]使用对流性稳定度指数、抬升指数、对流有效位能和700 hPa相当位温等指数综合预报闪电活动。陈秋萍等[8]、郝莹等[9]分别采用逐步消空法和指标叠加法进行基于对流参数的雷电预报。Solomon等[10]在研究新墨西哥州雷暴时,使用了对流有效位能和抬升指数等因子,并发现当对流有效位能的值>400 J·kg-1时,可以较好地预报闪电活动的发生,而抬升指数不是预报闪电活动的关键因子。

上述研究中,对单个或少数对流参数的研究较多,对各种对流参数与雷暴的相关性进行全面考察的少;且以有限的个例为研究样本较多,建立基于长时间序列样本,预报效果较稳定的雷暴预报方程的少。此外,从上述研究可以看出,由于地域的差异及预报方法的不同,雷暴事件与一些参数的相关性也存在一定差异。本文分析了江苏省洋口港地区2001—2009年4—9月1645个样本22种对流参数与雷暴事件的相关性及统计特征,优选因子,采用二级逻辑回归的方法,逐月建立雷暴预报方程,形成较为完善、稳定的基于对流参数的雷暴预报方法。

1 本文所使用资料

本文根据江苏省气象台普查后取得的NCEP再分析资料,经整理后借助MICAPS 3.0的T-lnp软件模块,计算2001—2009年4—9月1645个样本中(其中雷暴日242天,非雷暴日1403天)江苏地区154个格点不同时刻的22种对流参数,并选取处于洋口港地区的所有格点的各参数的算术平均值作为该区域相应参数的历史资料。

本文所使用的雷暴日资料来源于江苏省气候中心,因洋口港开发建设不久,没有专门的雷暴观测资料,所以使用其相邻市县观测站2001—2009年4—9月的雷暴日资料,规定若其相邻市县同时有2个或以上发生雷暴活动,则记为该区域的雷暴日。

2 预报因子的选取 2.1 各因子的相关系数

将该区域当日是否是雷暴日情况设为Y,有雷暴时,Y=1,无雷暴时,Y=0,则Y为“0”、“1”变量。Xi是各参数值,为连续型变量。使用下式求出XiY的点双序列相关系数[11],可以考察各个参数XY之间的相互关系(线性相关)。

$r = \frac{{\bar X\left( 1 \right) - \bar X}}{{{S_X}}}{\left( {\frac{P}{{1 - P}}} \right)^{\frac{1}{2}}}$ (1)

式中,X为因子Xi的平均值,X(1) 为Y=1时,Xi的平均值,PY=1事件出现的频率,SX为因子的样本标准差。

使用式(1) 求得1645个样本(其中雷暴日242天,非雷暴日1403天)中各因子各自与当日是否为雷暴日情况Y的点双序列相关系数,相关系数大于0.3的参数如表 1,并且均通过双尾检验[11] Sig.(2-tailed)<0.05。

表 1 1829个样本中与是否发生雷暴相关性较好的对流参数 Table 1 Indexes in close correlation with thunderstorms

表 1可以看到,沙氏指数、条件对流稳定度指数、全总指数、抬升指数、对流稳定度指数、对流有效位能、风暴强度指数、杰弗逊指数、K指数、抬升凝结高度温度、上下层温差、大气可降水量、修正K指数、莱克利指数、风暴相当螺旋度与是否发生雷暴情况Y的点双序列相关系数在0.3以上,沙氏指数最高,达到0.544。其中,沙氏指数、抬升指数、对流稳定度指数、条件对流稳定度指数这几个因子均是通过计算气块在不同高度处的温度差来反映大气的不稳定情况,公式和物理意义相似,根据预报因子不可重复的原则,故只选取其中相关系数最大的沙氏指数;同理,K指数、修正K指数只选取K指数,杰弗逊指数、莱克利指数只选取杰弗逊指数;对流有效位能与风暴强度指数只选取风暴强度指数。

2.2 各因子在有无雷暴情况下的统计特征

统计学中,箱线图(Boxplot,又称箱图)可以直观地反映较大容量样本的值分布情况,并且排除异常数据点[12]图 1是2001—2009年1645个样本中有无雷暴情况下各对流参数的箱图。理想情况下,当某预报因子在有无雷暴情况下取值完全不同,即值域不相交时,则该因子对雷暴预报具有完全的指示作用,此时有无雷暴情况下的箱图在y轴应没有任何交集,即任意一个y值至多只经过一个箱图。从图 1看到,各参数有无雷暴时的箱图均存在一定的交集,有些相交较少,如图 1a的沙氏指数;有些则相交较多,如图 1dK指数和图 1i的风暴相当螺旋度。显然,交集越少,则该参数对雷暴的指示作用越好。设各因子涵盖90%雷暴事件的取值区间为θi,非雷暴情况下,各因子取值落在θi区间内的频率η图 2所示。可以看到,SITTJItcl_tdt_58、pwSSIη均未超过30%,有无雷暴情况下的取值交加较少(如图 1abcefgh),对于是否发生雷暴事件具有良好的指示作用。而K指数和风暴相当螺旋度的η分别为38.7%和52.8%,值域在有无雷暴情况下存在较多的交集(如图 1di)。因此,若引入K指数或风暴相当螺旋度作为预报因子,必然会带来较多的空报。

图 1 2001—2009年1645个样本有无雷暴情况下各对流参数的箱线图 (短实线:第1百分位数和第99百分位数,长实线:中位数,矩形下边线:第10百分位数,矩形上边线:第90百分位数) Fig. 1 Box-whisker plots of the 9 indexes in thunderstorms and fine weather of the 1645 samples (top and bottom bars:the 1st centile and 99th centile, long bars:the median, the bottom of the box:10th centile, the top of the box:90th centile)

图 2 非雷暴事件中各参数处于雷暴所在区间的频率 Fig. 2 Intersection of indexes in lightning events and fine weather

所以,本文使用沙氏指数SI、全总指数TT、杰弗逊指数JI、抬升凝结高度温度tcl_t、上下层温差dt_58、大气可降水量pw、风暴强度指数SSI这7个参数作为预报因子。

3 预报方程的建立 3.1 各参数的月分布特征

统计了2001—2009年4—9月洋口港地区的242次雷暴事件,得到各参数雷暴日的月均值分布如图 3。沙氏指数、杰弗逊指数、抬升凝结高度温度、大气可降水量、风暴强度指数的雷暴日均值均是在7、8月份达到正的或负的最大值,4、5月份相对较小,这是因为7、8月份对流活动最为旺盛,气层不稳定程度高;全总指数、上下层温差则是在4、5月份达到正的或负的最大值,这可能是由于这两个参数公式中的T500春季容易出现较强低温。可见各参数都存在明显的月变化特征,因此,本文对4—9月逐月建立预报方程。

图 3 2001—2009年洋口港地区各参数雷暴日的月均值 Fig. 3 Monthly average of every index during 2001-2009
3.2 使用二级逻辑回归法建立各月预报方程 3.2.1 建立预报方程

逻辑回归的基本思想是把预报量和因子均看成随机事件,随机事件出现与否用“0”和“1”表示,把预报量事件yn个预报因子x1, x2, …, xn事件之间的关系看成是n个因子已经出现的条件下事件出现与否的关系,则可以建立对预报量y的条件期望。逻辑回归中X为各因子“0”、“1”化之后的矩阵。Y作为预报量,也要进行“0”、“1”化,当该样本为该区域的雷暴日时,则设y=1;否则,设y=0。

考虑各因子物理意义的相对独立性,并经过上述7个参数的组合试验以达到最佳拟合效果,第一级排空回归,我们选用含水量指标pw、稳定度指标沙氏指数SI、热力指标全总指数TT和综合性指标杰弗逊指数JI作为因子。各因子的“0”、“1”化方法是:以各因子雷暴事件中的四分位数作为临界值,即将9年中各月各因子雷暴日的取值由小到大排列,并分成四等份,处于第一个分割点位置的是第一四分位数Q1,处于第三个分割点位置的是第三四分位数Q3[11]。从上一章中图 1可以看到,pwTTJI雷暴日的取值较非雷暴日大,则XiQ1时,设为“1”,否则设为“0”;SI雷暴日的取值较非雷暴日小,则XiQ3时,设为“1”,否则设为“0”。经过拟合计算,得到排空回归方程(为便于阅读,式中因子用()括起,下同):

$y = {b_0} + {b_1}\left( {JI} \right) + {b_2}\left( {SI} \right) + {b_3}\left( {TT} \right)$ (2)

回归结果得到,雷暴情况下,即当y=1时,使用上式求得的预测y′≤k1,则将样本中经式(2) 计算后得到的预测y′>k1的排除,剩余样本进入第二级预报回归。

第二级预报回归使用风暴强度指数SSI,抬升凝结高度温度tcl_t,上下层温差dt_58作为参数。各因子的“0”、“1”化也是以各因子雷暴事件中的四分位数作为临界值。对于SSItcl_t,当XiQ1时,设为“1”,否则设为“0”;对于SI,当XiQ3时,设为“1”,否则设为“0”。经过拟合计算,得到预报方程:

$y = {c_0} + {c_1}\left( {SSI} \right) + {c_2}\left( {tcl\_t} \right) + {c_3}\left( {dt\_58} \right)$ (3)

回归结果得到,雷暴情况下,即当y=1时,使用上式求得的预测y′≥k2,则当样本中经式(3) 计算后得到的预测y′>k2时,作为预报有雷电发生的阈值。

使用上述方法,逐月求得排空方程和预报方程如表 2

表 2 各月预报方程 Table 2 Monthly forecasting equations

对各月的二级回归方程均进行了F检验[12],并且求得“0”、“1”化之后的回归因子与预报量的复相关系数如表 2。Sig.F∈[4.99×10-6, 0.0065],所以认为我们建立的回归模型是可以接受的[11];复相关系数R∈[0.49, 0.8],雷暴事件集中的6—8月R值均在0.6以上,说明我们选取的因子和设立的门限对于预报量具有良好的指示作用。

3.2.2 拟合结果分析

使用上述方法,对2001—2009年4—9月的1645个样本进行拟合结果分析,其中[13]

$命中率POD = \frac{{{n_1}}}{N}$ (4)
$虚警率FAR = \frac{{n\prime }}{n}$ (5)
$临界成功指数CSI = \frac{{{n_1}}}{{N + n\prime }}$ (6)

式中,N为实况雷暴事件次数,n1为报出的雷暴事件次数,n′为预报有雷暴实况无雷暴事件次数,n为预报有雷暴次数。

表 3可见,命中率的平均值为84.9%,最高为7月的91.5%,最低为5月的80.0%;虚警率的平均值为26.1%,最低为7月的21.2%,最高为5月的33.3%;临界成功指数的平均值为62.8%,最高为7月的70.3%,最低为5月的55.7%。因此可以认为我们建立的预报模型拟合程度较好。

表 3 拟合结果分析 Table 3 Analysis of fitting results
3.2.3 对2010年4—9月184个样本进行试报

使用上述方法,对2010年4—9月的样本进行试报,样本容量184个,其中,雷暴日31天,非雷暴日153天。试报结果为:报警41次,命中27次,空报16次,命中率87.1%,虚警率39%,临界成功指数57.4%。

各月的预报结果如表 4,可以看到,各月雷暴事件命中率均在80.0%以上,7—9月份的临界成功指数较高。由于2010年5月没有发生雷暴,4和6月雷暴事件分别只有1和2次,样本较少,试报结果难免具有一定偶然性,需要更多样本进行验证。

表 4 2010年184个样本试报结果 Table 4 Test forecasting results of the 184 samples in 2010
4 小结和探讨

本文基于洋口港地区2001—2009年4—9月1645个样本,探讨了对流性天气指数对于雷电预报的指示作用,得到以下结论:

(1) 本文计算分析22种对流参数与雷暴事件的相关性得出:沙氏指数、全总指数、杰弗逊指数、抬升凝结高度温度、上下层温差、大气可降水量、风暴强度指数等参数的点双序列相关系数较高,在0.3以上;且在不同天气条件下(是否发生雷暴)的区分度较好,在涵盖90%雷暴事件的参数区间内,非雷暴事件发生的概率都没有超过30%,对于雷暴具有良好的甄别指示作用。

(2) 本文统计了2001—2009年4—9月洋口港地区的242次雷暴中各参数的逐月均值,分析得到:沙氏指数、杰弗逊指数、抬升凝结高度温度、大气可降水量、风暴强度指数的雷暴日均值均是在7、8月达到正的或负的最大值,4—9月相对较小;全总指数、上下层温差在4、5月达到正的或负的最大值。各参数均存在明显的月变化特征。

(3) 本文选择与雷暴事件具有较好相关性的参数作为因子,并考虑到各参数月际数值分布差异,使用不同月份的pw,SI,TT,JI的不同阈值作为排空因子,不同月份的SSI,tcl_t,dt_58的不同阈值作为预报因子,使用二级逻辑回归法建立排空方程和预报方程。经检验,复相关系数R>0.48,Sig.F<0.02;经拟合结果分析,命中率平均值为84.9%,虚警率平均值为26.1%,临界成功指数的平均值为62.8%;使用2010年4—9月184个样本(31个雷暴事件)进行试报,临界成功指数为57.4%,达到一定预报效果。

由于本文所使用的样本中4、5和9月的雷暴事件较少,预报结果难免存在一定的偶然性,还需要更多的资料进行验证。另外,我们的预报方法没有考虑与环流形势的结合和触发因子,接下来的工作中,我们将开展这方面的研究,进一步改进和完善我们的预报方法。

参考文献
郑媛媛, 姚晨, 郝莹, 等, 2011. 不同类型大尺度环流背景下强对流天气的短时临近预报预警研究[J]. 气象, 37(7): 796-801.
苏永玲, 何立富, 巩远发, 等, 2011. 京津冀地区强对流时空分布与天气学特征分析[J]. 气象, 37(2): 177-184. DOI:10.7519/j.issn.1000-0526.2011.02.007
陈艳, 寿绍文, 宿海良, 2005. CAPE等环境参数在华北罕见秋季大暴雨中的应用[J]. 气象, 31(10): 56-61. DOI:10.7519/j.issn.1000-0526.2005.10.014
赵秀英, 吴宝俊, 2005. 风暴强度指数SSI[J]. 气象, 26(5): 55-56. DOI:10.7519/j.issn.1000-0526.2005.05.012
高守亭, 孙淑清, 1986. 应用里查逊数判别中尺度波动的不稳定[J]. 大气科学, 10(2): 171-182.
张翠华, 张义军, 郄秀书, 等, 2002. 平凉地区对流风暴地闪活动与环境层结因子相关性分析[J]. 高原气象, 21(6): 632-636.
郑栋, 张义军, 吕伟涛, 等, 2005. 大气不稳定度参数与闪电活动的预报[J]. 高原气象, 24(2): 196-202.
陈秋萍, 冯晋勤, 李白良, 等, 2010. 福建强天气短时潜势预报方法研究[J]. 气象, 36(2): 28-32. DOI:10.7519/j.issn.1000-0526.2010.02.004
郝莹, 姚叶青, 陈焱, 等, 2007. 基于对流参数的雷暴潜势预报研究[J]. 气象, 33(1): 52-56. DOI:10.11676/qxxb2007.005
Solomon R. Baker M, 1994. Electrification of New Mexico thunderstorms[J]. Mon Wea Rev, 122: 1878-1886. DOI:10.1175/1520-0493(1994)122<1878:EONMT>2.0.CO;2
柳金甫, 王义东, 2006. 概率论与数理统计[M]. 武汉: 武汉大学出版社, 240.
胡良平, 2010. SAS统计分析教程[M]. 北京: 电子工业出版社, 365-399.
王铭才, 1994. 大气科学常用公式[M]. 北京: 气象出版社, 275.