基于症状等多源数据的急性呼吸道传染病发病趋势预测模型的构建与评价
Construction and evaluation of a prediction model for the trend of acute respiratory infectious diseases based on multi-source data including symptom surveillance
摘要目的 构建基于多源数据的遗传算法优化的支持向量机(Genetic Algorithm optimized Support Vector Machine,GA-SVM)模型预测急性呼吸道传染病并评价其预测效果,为建立呼吸道传染病早期预警体系提供参考.方法 根据2020-2022年上海市徐汇区的症状监测、气象及大气污染和严格指数数据,在潜在预测变量中挑选最佳延迟周数的预测变量后,筛选出预测重要性最强的变量作为自变量.按1∶4比例将全时间序列划分为验证集和训练集,利用遗传算法优化参数,以呼吸道传染病每周新增病例数为因变量构建GA-SVM模型.采用均方根误差、平均绝对百分比误差、预测相关系数和决定系数对模型预测结果进行评价.结果 预测重要性最强的变量为:延迟2周的严格性指数、延迟1周的症状监测病例数、延迟1周的最高气温、延迟2周的学校活动和延迟1周的臭氧(O3)指数.建立的GA-SVM模型最优参数C=18.04,γ=0.175 4,模型的平均均方根误差为6.362,平均绝对百分比误差为24.59%,平均预测相关系数和决定系数分别为0.896和0.804.结论 该模型对于徐汇区急性呼吸道传染病报告病例数有着良好的预测效果,证实了GA-SVM应用于基于症状等多源数据实现呼吸道传染病预测的可行性,为多源数据应用于传染病早期预警提供方法参考.
更多相关知识
- 浏览7
- 被引0
- 下载0

相似文献
- 中文期刊
- 外文期刊
- 学位论文
- 会议论文