脓毒症患者住院期间死亡风险的随机森林分析与预测模型评估
Analysis and prediction model evaluation of in-hospital mortality risk in sepsis patients by random forest
摘要目的 通过不同算法分析影响脓毒症患者住院期间死亡的危险因素,并以此构建预测模型.方法 回顾性选取2021年1月至2025年6月于厦门市第五医院重症医学科就诊的脓毒症患者316例,根据是否在住院期间发生死亡分为死亡组(61例)以及存活组(255例).本研究首先采用单因素和多因素Logistic回归分析筛选相关危险因素,并在此基础上建立Logistic回归预测模型.随后使用Boruta算法和随机森林模型进行变量重要性排序与建模.采用受试者操作特征(ROC)曲线分析Logistic回归分析模型与随机森林模型的预测效能,选择表现更优的模型用于后续建模.基于最优算法中筛选的重要变量构建列线图,通过Bootstrap算法进行内部验证,同时采用ROC曲线、C指数、Hosmer-Lemeshow拟合优度检验及决策曲线分析对模型的综合性能进行评估.结果 Logistic回归分析模型识别出的影响因素从高到低分别为血乳酸、外周灌注指数、血清白蛋白、血尿素氮、血肌酐、丙氨酸氨基转移酶(ALT)以及天冬氨酸氨基转移酶(AST).随机森林模型以血乳酸、外周灌注指数、血清白蛋白、血肌酐、血尿素氮及ALT为主要预测变量.ROC曲线分析显示,Logistic回归分析模型曲线下面积为0.835(95%CI:0.784~0.879),随机森林模型曲线下面积为0.901(95%CI:0.867~0.934),Logistic回归分析模型与随机森林模型曲线下面积差异为0.072(95%CI:0.016~0.128;Z=2.480,P=0.013).基于随机森林模型关键变量构建的列线图预测模型,在训练集与验证集中的曲线下面积分别为0.816和0.872,C指数分别为0.823、0.886,Hosmer-Lemeshow拟合优度检验P值均>0.05,提示该模型拟合良好.决策曲线分析显示,在各自的阈值范围内(训练集0.20~0.92,验证集0.10~0.94),模型具有稳定且优于传统策略的净收益,具备良好的临床实用性.结论 血乳酸、外周灌注指数、血清白蛋白、血肌酐、血尿素氮及ALT是脓毒症患者住院期间死亡的重要影响因素.与Logistic回归分析模型比较,随机森林模型在预测效能上更优,结合其变量重要性结果构建的列线图预测模型表现出良好的鉴别效能、拟合度及临床实用性,具备一定的临床推广价值.
更多相关知识
- 浏览1
- 被引0
- 下载0

相似文献
- 中文期刊
- 外文期刊
- 学位论文
- 会议论文


换一批



