基于随机森林算法的南京地区脑卒中风险预测模型构建
Construction of a risk prediction model for stroke based on random forest algorithm in Nanjing,China
摘要目的 利用南京地区脑卒中患者医院诊疗数据,构建基于随机森林算法的脑卒中风险预测模型并探索脑卒中的危险因素,为早期干预和临床治疗提供参考.方法 选取2014年5月至2022年12月南京市某三甲医院的5 357名住院病人作为研究对象,其中神经内科出院主诊断为脑卒中的患者(3 104例)作为脑卒中组,医院同期就诊的非脑卒中患者(2 253例)作为对照组.按照8∶2的比例随机分为训练集(4 285例)与测试集(1 072例),纳入人口统计学数据、临床化验指标、气象数据及环境数据,分析脑卒中患者的危险因素,通过5折交叉验证和参数调整优化模型,通过准确率、精确率、召回率、F1分数和AUC值评估模型的预测性能,运用SHAP值对模型特征进行量化和归因分析.结果 脑卒中前十位的危险因素依次为收缩压、年龄、血糖、中性粒细胞计数、白蛋白、钾、舒张压、总蛋白、总胆固醇、载脂蛋白A1.基于随机森林算法的脑卒中风险预测模型的准确率、精确率、F1分数、召回率和AUC值分别为0.78、0.76、0.72、0.69和0.85.结论 基于随机森林算法的预测模型有助于辅助早期识别和捕获脑卒中患者,为及时采取干预措施提供关键信息,具有较好的应用价值.
更多相关知识
- 浏览16
- 被引1
- 下载19

相似文献
- 中文期刊
- 外文期刊
- 学位论文
- 会议论文