基于机器学习算法的初治结核病患者复发预测模型研究
Prediction model for tuberculosis recurrence in newly treated patients based on machine learning algorithms
摘要目的 基于新疆喀什地区结核病常规监测数据,系统比较7种机器学习算法构建的初治结核病患者复发预测模型的效能,为高负担地区优化复发干预策略提供数据支持.方法 以喀什地区2016-2022年成功治疗的初治结核病患者为研究对象,分析其截至2023年末的复发情况.通过多因素logistic回归筛选独立预测因子,并基于logistic回归、决策树、随机森林、多层感知器、极限梯度提升树、轻量级梯度提升机算法和弹性网络构建并验证复发预测模型,对最优模型通过采用沙普利加性解释(SHapley additive exPlanations,SHAP)法解析变量贡献度.结果 纳入的69 476例研究对象截至2023年末复发9 444例(13.59%).通过logistic回归确定出14个独立预测因子,7种预测模型训练集AUC值范围为0.705~0.762,其中决策树模型表现最优(AUC=0.762,95%CI:0.758~0.766),且校准度良好.基于SHAP值的变量重要性排序结果显示,初诊痰培养结果、现住地结核病负担及就诊方式是前三位重要预测因子.结论 基于常规监测数据构建的决策树模型对初治结核复发具有较高预测效能,其可解释性特征有助于临床优先识别高危个体.
更多相关知识
- 浏览8
- 被引0
- 下载0

相似文献
- 中文期刊
- 外文期刊
- 学位论文
- 会议论文


换一批



