2. 北京市海淀区疾病预防控制中心;
3. 天津市气象科学研究所
2. Center for Disease Prevention and Control of Haidian District, Beijing;
3. Weather scientific Academe of Tianjin
感染性腹泻疾病是北京地区夏、秋季节的常见流行性疾病或疫情。它的发生、发展与蔓延与环境气象条件密切相关。根据已有的历史病例和同期天气气候资料, 研究感染性腹泻疾病与天气气候的相关关系, 建立医疗气象预报模型, 可逐日滚动预测未来6种时效(即24~48、24 ~72、24~96、24~120、24~144、24~168小时,下文不再详述这6个时效)的疾病疫情发生、发展与蔓延趋势及风险水平评估产品, 有利于贯彻“预防为主”的方针, 可在很大程度上为疾病预防控制中心提供疾病可能流行的气候背景,指导广大城乡居民防病治病, 保障居民身体健康[1-2]。
1 资料与因子相关分析 1.1 资料来源感染性腹泻疾病逐日发病病例,取自北京市海淀区疾病预防控制中心。自2004年1月1日至2006年12月31日, 共搜集到病例样本1092个,仅有4天缺测。病例涵盖人口,约为250万。同步地面气象因子由北京市观象台提供,包括逐日地面基本气象要素9个(含1.平均气温2.极端最高气温3.极端最低气温4.平均相对湿度5.最小相对湿度6.平均水汽压7.日降水量8.平均风速9.平均海平面气压)。因子样本数9×1096个,没有缺测。
1.2 感染性腹泻疾病发病的统计学特征感染性腹泻疾病,一年四季都有发生,但以盛夏至秋季最甚,此现象与北京的暴雨季相吻合[3], 详见图 1。感染性腹泻疾病发病的统计参数值,详见表 1。从表 1所列数据不难看出,感染性腹泻疾病日平均发病人次,每百万人口约为7.2,中位数为4.4,由于中位数远小于平均值,概率分布显然不属于正态分布类型。
所谓环境气象因子,是指根据北京市观象台9个地面基本气象要素,按一定方法加工派生而成[4-5]。其中,因子1、4、5、6、7、8、9是因子源值的等权或半衰权重的平均值;因子2和10是过去7天逐日的气温、气压变化倾向值,其计算方法是将因子源值先用直线方程拟合,求解得出斜率值再乘以方程相关系数的绝对值;因子3是日较差。为了找出感染性腹泻疾病发病与环境气象因子之间的相关关系,采用经典方差贡献分析技术,现将部分计算结果列于表 2。因子Xi的方差贡献值PVi,即因子的偏回归平方和,是因子重要性的度量方法之一, 常用式(1)计算。
$ P{V_i} = B_i^2/{C_{ii}}/{L_{yy}} $ | (1) |
式(1)中,i=1、2、3.…….m,Bi2为因子Xi的偏回归平方和,Lyy为感染性腹泻疾病发病的原方差,Cii为正规方程系数逆矩阵对角线元素。为便于不同因子相互比较,表 2中,已将其处理为百分比(表 2中的方差贡献值、总体复相关系数、统计量F值均是以预测时效24~72小时参数为例)。
从表 2数据不难看出:感染性腹泻疾病发病与水汽压Vp相关密切,单相关系数可达0.8 340(当样本数目超过1000时,通过信度a=0.01检验的相关系数下限阈值Ra,仅为0.081),该因子的方差贡献值可占总贡献的70.6%。加上方差贡献较大平均风速、气温日较差因子,贡献值可升至93.4%。其次,所有因子的复相关系数平均可达0.8591,统计量F值,可达298.1。远远超过了通过F检验所需的下限阈值(α=0.05, Fα=1.83)。这就证明,感染性腹泻疾病发病与气象因子群之间是少见的高度相关,利用环境气象因子的变化预测北京地区未来感染性腹泻疾病发病趋势,是完全可行的。
通常,感染性腹泻疾病的病菌从适宜的温湿环境中生长繁殖到通过苍蝇等传播媒介污染生冷食物,最终感染人体。人们生活实践的常识,认为连续的高温高湿的气象条件非常易于食物霉变、并会促进病菌的繁殖和延长病菌的生存时间,通过污染的手、食品、水源或苍蝇、蟑螂等间接媒介传播最终经口入消化道使易感者受感染;又因为天气闷热,人们喜欢大量食用生、冷食品使胃肠道防御功能降低导致感染性腹泻的发病流行。感染性腹泻疾病发病的过程反映了水汽压在诸气象因子中贡献最大的特点。
2 医疗气象预报建模与评估疾病流行风险水平的思路与方法感染性腹泻病医疗气象预报与流行风险水平评估采用5档分级的方法。不同的级别,对应不同的疾病发病人数及流行风险水平。为此,通过下面两个步骤来完成。
2.1 组建逐日发病人次滚动预报的多元回归模式本文,采用经典回归技术建立预报模型。该模式可写为下式,即
$ {Y_i} = {B_0} + \sum {{B_j} * } {X_j} $ | (2) |
式(2)中,Yi为每百万人口的平均日发病人次的回归拟合值。Xj为进入方程的预报因子。Bj(j = 1, 2, … m)为相应的回归系数、B0为常数系数,可通过求解正规方程获取。
经典回归模式的正规方程为:
$ \mathit{\boldsymbol{X}}'\mathit{\boldsymbol{XB}} = \mathit{\boldsymbol{X}}'\mathit{\boldsymbol{Y}} $ | (3) |
式(3)中,X’X为因子协方差矩阵,可以根据因子的方差贡献的大小预选n个因子组合搭配建模,或采用逐步回归技术自动筛选。根据我们的试验,后者统计味道过浓,而前者可以综合考虑压、温、湿、风不同量纲因子搭配组合,预报方程稳定,效果更佳。X’Y为相应气象因子与感染性腹泻疾病的交叉平方和,B为回归系数向量。具体建模之前,需从已经搜集的原始样本序列中,连续滑动地截取预报单元(P+T),作为对应不同预报时效的有效样本备用。前者对应过去P天的气象因子连续取值区间,后者对应未来T天平均发病的取值区间。不同建模时效对应的各年最大可能样本数为: 365+Lp-(P+T)+1。闰年Lp=1,否则为0。我们共做了6种时效的建模试验。在此,使用6个精选气象预报因子(气温X1、气温较差X3、最小相对湿度X5、水汽压X6、平均风速X8、海平面气压X9),仅给出预报未来72小时时效的感染性腹泻疾病的回归预测模式(其他5个时效同样用该6个预报因子):
$ {Y_{72}} = -365.7268 + 0.05503434{X_1}-0.6254867{X_3}-0.6541398{X_5} + 4.133605{X_6}-4.797883{X_8} + 0.3904339{X_9} $ | (4) |
式(4)中的Y72为感染性腹泻疾病的未来72小时百万人口发病人次的预测值。模式的复相关系数为0.8677,统计量F值为539.66。
2.2 疾病预报分级与流行风险水平的评估同步评估疾病流行风险水平与预报结果的气象分级,应用概率积分的方法进行评估与分级。该方法的要点是:
首先,按照评估疾病流行风险水平(用4种医学、气象概率密度分级试验)的实际需要,确定不同的分级概率标准。比如,概率标准定为5级,各级所占概率分别为P5、P4、P3、P2和P1。注意,∑Pi=1(i=5, 4, …, 1)这将意味着式(2)的预报结论中,将有Pi×100%的预报结果可以期望降落到第i级。
其次,如何判断式(2)预报结果Yi的级别归属?如果仍将概率标准定为5级,在样本的连续域上, 为了分5个等级,须有4个分点即g4、g3、g2和g1。
当Yi>g4预报5级。发病人数将显著增多, 流行风险水平很高。
当Yi>g3 and Yi≤g4预报4级。发病人数较多, 流行风险水平较高。
当Yi>g2 and Yi≤g3预报3级。发病人数呈现增多趋势, 流行风险水平中等
当Yi>g1 and Yi≤g2预报2级。发病人数较少, 流行风险水平较低。
当Yi<g1预报1级。发病人数很少, 流行风险水平很低。
分界指标g1、g2、g3和g4的获取,可以根据指定的概率密度标准P1、P2、P3、P4、P5,对式(2)作概率积分,当曲边梯形的面积,分别达到∑Pi 时,所记录的4个分点位置gi(i = 1, 2, 3,4), 即为5级的分界指标。余可类推,不再赘述。
3 结果分析 3.1 所建模型对历史资料的回代模拟首先,指定一种预报时效及相应的概率分级标准,对所有历史样本实况进行同步分级(含流行风险水平评估,下同),再用同期气象因子值回代式(2),获得所有建模样本的拟合预报分级。现以概率密度标准:0.15 0.20 0.30 0.20 0.15为例(过去7天气象资料,预报未来6种时效),拟合结果的比较见表 3。
从表 3数据可以看出,如果以预报结果与实况相差±1级以内算作正确的话,不同时效的拟合正确率,平均可达95%以上。预报级别与实况完全一致的,约占51%左右。
3.2 不同概率密度标准对拟合准确率的可能影响在5级分档概率密度标准中,如果适当降低两端概率密度P1、P5的取值,即调整到医学常用的概率密度分布函数:0.03594、0.23831、0.4515、0.23831、0.03594。注意,需保证∑Pi=1。仍使用过去7天气象资料,预报未来2~7天的模型,则拟合准确率有如下变化,详见表 4。
表 4中,是针对两端概率适当下调,总的拟合正确率平均提高了大约1~2个百分点;级别完全符合的百分率,平均可提高14个百分点;相差±1级的百分率,平均降低了11个百分点。经过这样的调整,拟合准确率有明显改善,但预报产品结果中,出现在1级或5级的心理期望概率,必然有所降低,是符合感染性腹泻疾病的流行风险很大的水平为小概率事件现象。
4 服务应用检验应用感染性腹泻疾病预测模式,预测出未来6种时效的逐日的感染性腹泻疾病发病等级与北京市海淀区2007年逐日监测病例比较,统计出各时效的感染性腹泻疾病预报准确率,其效果是理想的,见表 5。
本研究方法与同步应用软件通用性较强,只要搜集到当地较大样本发病资料,即可运行建模,并试验发布预报。当取得更多资料时,还可对原有模型参数优化。目前,感染性腹泻病疾病医疗气象预报软件,经过气象科技服务业务的试验应用,感觉操作逻辑流畅,产品丰富图文并茂,还可以方便查询各种相关信息,预测效果较为理想。在奥运赛期,与北京市海淀区疾病预防控制中心合作,为奥运组委会提供较准确的感染性腹泻发病趋势预测产品,也可以为首都的市民提供预防感染性腹泻病的科学信息,提高百姓的身体健康水平。
[1] |
张德山, 王玉玲, 谢庄. 天气变化影响人体健康的信息与预报[J]. 气候与环境研究, 1999, 4(1): 32-34. |
[2] |
张庆阳, 琚建华, 王卫丹. 气候变暖对人类健康的影响[J]. 气象, 2007, 35(2): 245-248. |
[3] |
张德山, 邵明轩, 穆启占, 等. 密云水库流域暴雨的短期预报方法研究[J]. 气象, 2006, 32(11): 61-64. |
[4] |
屠其璞, 王俊德, 丁裕国, 等. 气象应用概率统计学[M]. 北京: 气象出版社, 1984.
|
[5] |
宛公展, 王宝成, 弥明祥. PC-1500袖珍计算机BASIC语言应用程序集[M]. 北京: 气象出版社, 1988: 132.
|