2. 上海市城市环境气象中心, 上海 200135;
3. 上海市气象与健康重点实验室,上海 200030
2. Shanghai Center for Urban Environmental Meteorology, Shanghai 200135;
3. Shanghai Key Laboratory of Meteorology and Health, Shanghai 200030
据统计(路凤等,2008),世界上三分之一的人患有心脑血管疾病,每年有1500万人被心脑血管疾病夺取生命,占死亡人数的60%以上,而我国每年因心脑血管疾病造成死亡的人数约260万(刘方等,2004)。近年来卫生部调查资料显示,呼吸道与心、脑血管疾病的发病率位于前列,并有逐年升高的趋势,而脑血管疾病死亡率跃居首位。脑血管疾病的成因包括环境、情绪、生活习惯等多种因素,临床观测证明,在气象条件变化较大时,急性脑血管疾病人数增多。目前国内外许多研究也已证实(Shin et al, 1990; 卢爱梅等,1997;刘世玲等,1999),气象条件变化是脑血管疾病发病和死亡的主要诱因之一。
脑血管疾病的发生具有一定的确定性和随机性,根据气象条件变化对脑血管疾病的发生进行预测具有确定性和不确定性的双重特性。目前,国内针对脑血管疾病的预报研究多采用多元逐步回归(卢爱梅等,1997)、气象因子综合指标预报方法(张书余等,2010)、支持向量机(support vector machine, SVM)回归方法(毛清宇等,2010)和自动交互检测方法(automation interaction detector, AID)(韩建康等,2008)等,上述方法一般是根据气象因子和就诊人数或住院人数的统计关系建立预测模型。显然,根据传统的统计方法很难解决脑血管发病预测中存在的双重性,而人工神经网络(artificial neural network, ANN)由于其具有自学习、自组织的非线性映射能力,适合于一些信息复杂、知识背景不清楚和推理规则不明确问题的建模。利用人工神经网络的自组织学习能力,可以从影响疾病的气象要素中发掘有用的信息,从而识别出发病人数与影响因子之间的非线性映射关系。由于人工神经网络模型对非线性样本具有比传统回归模型更好、更强的拟合和预报能力,用于受多种气象要素综合影响的医疗气象预报非常可行有效。因此本文采用一种改进的ANN方法来建立气象条件变化与急性脑血管疾病发生的预测模型。
1 资料和方法 1.1 资料来源收集北京市120急救中心2006年1月至2010年12月的急性脑血管疾病接诊病例9005例,其中脑出血3481例,脑梗塞5524例。病例信息包括年龄、性别、接诊时间和临床诊断。
同期逐日气象资料来源于北京市气象局,包括9个地面基本气象要素:日平均气温(单位:℃)、水汽压(单位:hPa)、相对湿度(单位:%)、风速(单位:m·s-1)、海平面气压(单位:hPa)、日照时间(单位:h)、最高(最低)气温(单位:℃)和最低相对湿度(单位:%)。
1.2 资料处理由于转折性天气对急性脑血管疾病有较大影响,为了分析它们之间的关系,根据气象台提供的9个基本要素,进一步加工派生出24 h变温、24 h变压和气温日较差3个因子。因气象条件对疾病的影响存在连续性和明显的滞后性,选取发病人数与各要素的时间派生因子(X,X-1,X-2,X-3,X-X-1,X-X-2,X-X-3)分别进行相关分析。其中,X表示当天要素,X-1表示前1天要素,X-2前2天要素,X-3前3天要素。进行研究分析的基本和派生气象因子共计12×7个。
1.3 人工神经元网络方法目前最常用的人工神经网络方法是BP算法,它对各种复杂信息的处理能力非常强。BP(Back Propagation)网络,是一种单向传播的多层前向网络,训练过程分为两个阶段:正向过程和反向过程。正向过程是把学习样本的输入值循环置入BP网络的输入端,由前往后,依次计算网络的隐节点和输出节点的值;根据网络的输出值与期望输出值之间的误差,开始反向计算,即由后往前,按照训练的目标函数,依次调整网络各层节点之间的连接权值,直到目标函数接近极小值为止(董全等,2013;曾晓青,2013)。
在BP网络的学习算法中,权值修正一般采用梯度下降法, 各节点神经元的激励函数常采用Sigmoid函数, 其形式为:
$f(x) = \frac{1}{{1 + {{\rm{e}}^{ - x}}}}$ |
然而,传统BP算法在应用中存在许多亟待解决的问题,例如,网络训练过程中易陷入局部极小等,实际应用存在网络结构参数和学习训练参数难以确定的问题。为了方便实际应用,本文主要采用一种改进的BP算法进行预测模型的建立,该算法能有效解决传统算法中存在的问题,具体算法可参考文献(闵晶晶等,2010)。
2 结果与讨论 2.1 急性脑血管疾病发病特征 2.1.1 发病人数的时间变化特征北京地区急性脑血管5年总发病人数以冬季(12月至次年2月)最多,为2470人(27.4%);春季(3—5月)次之,为2315人(25.7%);秋季(9—11月)2176人(24.2%);夏季(6—8月)最少,为2044人(22.7%)。这和南京(毛清宇等,2010)、吉林(张书余等,2010)等地区冬春季发病高于夏秋季的结论基本一致。这是因为冬季和春季温度较低,强冷空气容易造成气温骤降,气压升高,湿度降低,研究表明(刘世玲等,1999;叶殿秀等,2003),这些气象要素的变化是促使脑血管发病的有利条件。春、秋季是季节转换期,气温等要素变化较大,对自然环境变化适应性能力较差的群体,容易出现脑血管疾病的加重或复发。冬季,当冷锋过境或过境后,可使交感神经兴奋,引起血管收缩以及血管平滑肌痉挛,血管阻力增加,血压升高,儿茶酚胺分泌液增多,使血小板形成血栓,从而诱发脑血管疾病的加重或发生。从各月份看,1和11月是全年发病最多的2个月,分别占总数的9.78%和9.28%;9和6月则是发病最少的2个月,分别占总数的6.97%和7.20%。
急性脑血管疾病发病人数存在明显的日变化(图 1),发病时段主要集中在早晨和中午的09:00—14:00,为4829人,占总人数的53.6%,尤其在日升温最快的09:00—11:00,急性脑血管疾病更易发生,这主要是与24 h血压位于10:00、上午交感神经张力增高和外界刺激与体力活动增多有关(刘涛等,2006)。而在夜间到凌晨(23:00—05:00),发病人数较少且变化幅度不大,可能由于该时段为休息时间,受外界环境影响较小,不利于诱发脑血管疾病的发生。
2006—2010年北京市急诊病例共9005例,其中男性5267例,女性3738例,男性较女性更容易出现急性脑血管疾病。
由2006—2010年不同性别的发病年龄分布曲线(图 2)得知,从小于10岁的儿童到大于100岁的老人,各年龄段均有急性脑血管疾病出现,其中病人最小年龄2天,最大年龄101岁。40岁之前发病人数较少,40岁以后发病人数随着年龄增大而迅速增加,到70—79岁达到高峰值。同时,80岁以下各年龄段男性发病人数明显多于女性,80岁以后略少于女性。尤其在30—59岁之间,男女总发病人数比约为3:1,远远大于其他年龄段。男女在50、60、70和80岁均存在明显的发病峰值。
在分析气象因子与急性脑血管发病人数的相关性发现,不同季节的影响因子有所差异,故本文针对不同季节分析两者的关系。同时相关研究(Capon et al, 1992)通过分析脑血管患者发病前气象要素的动态变化,即发病时的某一气象要素与病前24 h的同一气象要素的差值,通过判别分析得知气象要素动态变化的因子贡献最大,即气压、温度和湿度的剧烈变化均是导致脑血管发病的重要因子。对此,本文主要选取各要素的时间动态变化进行相关分析,图 3列出了脑血管发病人数与气象因子的相关系数(由于篇幅有限,列出主要因子),其中横坐标中Pi(i=1,…,7) 分别表示1.2节中描述的各要素的时间派生因子X,X-1,X-2,X-3,X-X-1,X-X-2和X-X-3,而X表示当天要素,X-1表示前1天要素,X-2前2天要素,X-3前3天要素;R(0.05) 和R(0.01) 分别表示相关系数通过α=0.05和α=0.01显著性检验的临界值。
春季发病人数主要与当天和前1~3 d的要素关系密切。发病人数仅与风速、海平面气压存在显著的正相关,与其他要素的相关性较差。
夏季发病人数主要与发病当天和前1~3 d的要素关系密切。发病人数与温度(气温、最高气温和最低气温)、风速、海平面气压呈明显的正相关,与水汽压和相对湿度也有较好的正相关。
秋季发病人数主要与发病当天的气象要素关系密切。发病人数与温度(气温、最低气温)、水汽压呈显著负相关,与风速、海平面气压、气温日较差存在明显的正相关。
冬季发病人数主要与发病当天与前1~2 d的要素关系密切。发病人数与温度(气温、最低气温、24 h变温)呈显著负相关,与水汽压、风速、海平面气压、气温日较差呈显著正相关。
根据四个季节的逐日发病人数与各气象要素的相关性分析结果可看出:不同季节中,气温对脑血管疾病都有一定程度的影响,且各因子对诱发脑血管疾病的发生存在滞后效应。其中,春季脑血管疾病的影响条件不明显;夏季,高温高湿天气容易影响脑血管疾病的发生;秋、冬季,当冷空气活动时,会导致大幅度降温,气压升高,带来较强的风,这些气象要素会影响到脑血管疾病的诱发。同时,夏季最高气温对发病人数也有明显的影响,而其他季节不存在这种相关,表明夏季日最高气温的增加可能是心脑血管疾病发病的一个危险性因素;而其他季节,日最高气温的增加反而作为一种保护性因素,能够减少心脑血管疾病的发生(王佳佳等,2009)。
2.3 急性脑血管预报模型 2.3.1 急性脑血管发病人数等级划分同步评估疾病流行性风险水平与预报结果的气象分级,一般应用概率积分的方法进行评估与分级。本文根据概率分布将北京急性脑血管疾病划分为4级,各级所占概率分别为P1、P2、P3和P4,其中∑Pi=1(i=1, 2, 3, 4)。其中1~4级分别表示日发病人数较少、偏多、较多和很多。
通过分析北京急性脑血管疾病的日发病人数的概率分布(图 4),四个季节中日发病人数的概率分布基本一致,多数集中在3~7人之间。根据概率分布方法,将P1、P2、P3和P4分别定为40%、30%、20%和10%。由于不同季节的日发病人数的概率分布有一定差异,故利用规定的概率积分值进行不同季节的发病等级划分,划分结果如表 1。
将相关系数通过α=0.05显著性水平检验的气象因子作为预报因子,日发病等级作为预报量。在预报模型建立前,先对各个因子进行归一化处理,有利于避免各个因子间的量级差异,然后将归一化的因子作为BP网络输入层的节点输入,而预报量作为预报输出。按照上述思路,采用2006—2009年的逐日发病人数资料分别建立春、夏、秋、冬脑血管日发病等级的预报模型并进行反算,然后利用预报模型对2010年逐日发病等级进行预报并进行检验。
在对历史样本的拟合结果和独立样本的预报结果进行检验时,主要采用两种方法:(1) 若预报值和实际值处于同一级别算完全正确,否则算错;(2) 若两者处于同一级或差一级算对,否则算错。
通过预测模型对2006—2009年逐日发病人数等级(历史样本)的拟合及2010年逐日发病人数等级(独立样本)的预报且进行检验。历史建模样本的检验结果(表 2)表明:夏季拟合效果最好,秋季和冬季次之,而春季最差。独立新样本的预报结果(表 3)表明:在发病人数较多的春、秋和冬季,预报结果的完全准确率都超过30%,相差1级的准确率超过60%,而在夏季准确率略低于这三个季节。
可以看出,发病较为集中的春、秋和冬季的历史拟合效果和独立样本的预报效果较为一致,而夏季的拟合结果较好,但预报效果不理想。根据预报值和真实值的对比(图略),预报值能较好地反映真实值的变化趋势,可见该方法具有较好的预报性。但由于模型对发病极值的预测水平较弱,导致预报准确性随着发病等级的提高而降低,同时,模型在夏季的预报推广能力较差,这是因为预报效果除了与网络模型的拓扑结构及各参数有关外,其本质上还取决于预报系统的预报因子与预报量的内在关系。而影响脑血管疾病发生的要素较复杂,本文仅考虑了气象因子,而一些非气象要素也是直接诱发脑血管疾病的重要原因,而在预报模型中无法得到体现。
3 结论本文通过相关分析分别选取不同季节的急性脑血管影响气象因子,并采用人工神经元网络方法构建了北京市急性脑血管疾病逐日发病等级的预测模型,主要结论如下:
(1) 北京急性脑血管发病人数具有明显的季节和日变化特征,冬春季发病高于夏秋季,发病人数主要集中在每天的09:00—14:00。40岁以后发病人数随着年龄增大而迅速增加,70—79岁达到高峰值,且男性明显多于女性。
(2) 春季脑血管疾病的影响条件不明显;夏季,高温高湿天气容易影响脑血管疾病的发生;秋和冬季,当冷空气活动时,会导致大幅度降温,气压升高,带来较强的风,这些气象要素会影响到脑血管疾病的诱发。同时,夏季最高气温对发病人数也有很不利的影响,而其他季节不存在这种相关。
(3) 根据概率积分方法,将发病人数划分为4个等级,利用人工神经元网络方法建立的预报模型,对2010年独立样本具有较好的预测效果,表明该方法具有一定的实际业务应用价值。
董全, 黄小玉, 宗志平, 2013. 人工神经网络法和线性回归法对降水相态的预报效果对比[J]. 气象, 39(3): 324-332. DOI:10.7519/j.issn.1000-0526.2013.03.006 |
韩建康, 刘小琦, 顾志伟, 等, 2008. 湖州市心脑血管疾病与气象因素的关系分析及预报研究[J]. 浙江预防医学, 20(12): 8-10. DOI:10.3969/j.issn.1007-0931.2008.12.004 |
刘方, 张金良, 陆晨, 2004. 我国气象因素与心脑血管疾病研究现状[J]. 气象科技, 32(6): 425-437. |
刘世玲, 刘济跃, 李志莉, 等, 1999. 脑血管发病与气象条件的关系[J]. 临床神经学杂志, 12(2): 76-78. |
刘涛, 范利, 李冬云, 2006. 组织多普勒成像评价血压昼夜节律变异对左心室舒张功能的影响[J]. 中华老年心脑血管病杂志, 8: 370-372. DOI:10.3969/j.issn.1009-0126.2006.06.004 |
路凤, 金银龙, 陈义斌, 2008. 气象因素与心脑血管疾病关系的研究进展[J]. 国外医学卫生学分册, 35(2): 83-87. |
卢爱梅, 徐红梅, 高谨, 等, 1997. 齐齐哈尔市心、脑血管疾病发病与气象要素的关系及其预测预报研究[J]. 中国慢性病预报与控制, 5(2): 61-63. |
毛清宇, 尹东屏, 孙宁, 等, 2010. 南京市心脑血管疾病的医疗气象预报研究[J]. 气象, 36(11): 82-87. DOI:10.7519/j.issn.1000-0526.2010.11.012 |
闵晶晶, 孙景荣, 刘还珠, 等, 2010. 一种改进的BP算法及在降水预报中的应用[J]. 应用气象学报, 21(1): 55-62. DOI:10.11898/1001-7313.20100107 |
王佳佳, 郭玉明, 李国兴, 等, 2009. 日最高气温与医院心脑血管疾病急诊人次关系的病例交叉研究[J]. 环境与健康杂志, 26(12): 1073-1076. |
叶殿秀, 杨贤为, 吴桂贤, 2003. 京、沪两地脑卒中发病率及其预测模型[J]. 气象科技, 31(6): 381-384. |
曾晓青, 2013. BP神经网络在建模中的参数优化问题研究[J]. 气象, 39(3): 333-339. DOI:10.3969/2012jms.0122 |
张书余, 王宝鉴, 谢静芳, 等, 2010. 吉林省心脑血管疾病与气象条件关系分析和预报研究[J]. 气象, 36(9): 106-110. DOI:10.7519/j.issn.1000-0526.2010.09.017 |
Capon A, Demeurisse G, Zheng L, 1992. Seasonal variation of cerebral hemorrhage in 236 consecutive cases Brussels[J]. Stroke, 23(1): 24-27. DOI:10.1161/01.STR.23.1.24 |
Shin kawa A, Ueda K, Hasuo Y, et al, 1990. Seasonal variation in stroke incidence in Hisayama, Japan[J]. Stroke, 21(9): 1262. DOI:10.1161/01.STR.21.9.1262 |