基于SHAP可解释性机器学习的老年糖尿病患者衰弱风险预测模型构建与验证
Develop and validate of a SHAP-interpretable machine learning-based frailty risk prediction model for older adults with diabetes
摘要目的 构建与验证基于可解释性机器学习的老年糖尿病患者衰弱预测模型,以早期识别高风险患者.方法 采用便利抽样法,选择 2024 年 1 月至 5 月本市某三级甲等综合医院住院的 232 例老年糖尿病患者作为研究对象.227 例患者完成研究,按照 7∶3 的比例随机分为训练集(158 例)与测试集(69 例),分别用于模型构建与验证.采用最小绝对收缩和选择算子(least absolute shrinkage and selection operator,LASSO)回归与Boruta算法筛选特征变量,并基于逻辑回归(logistic regression,LR)、支持向量机(support vector machine,SVM)和极端梯度提升树(extreme gradient boosting,XGBoost)构建机器学习模型.通过曲线下面积(area under curve,AUC)、灵敏度、特异度、F1 分数等指标评估模型性能,并通过DeLong检验比较模型间的AUC差异.最优模型利用沙普利加和解释(Shapley additive explanation,SHAP)方法,对关键预测因子进行解释,并基于Streamlit开发网页计算器,实现模型可视化.结果 227 例老年糖尿病患者中 99 例合并衰弱(43.6%).XGBoost模型综合表现最优,在训练集和测试集中,DeLong检验显示XGBoost的AUC高于LR和SVM(均P<0.001).训练集AUC为 0.920,准确性为 0.842,灵敏度为 0.783,特异度为 0.887,阳性预测值(positive predictive value,PPV)为 0.845,阴性预测值(negative predictive value,NPV)为0.840,F1 分数为 0.810.测试集AUC为 0.806,准确性为 0.681,灵敏度为 0.633,特异度为 0.743,PPV为 0.731,NPV为 0.744,F1 分数为 0.620.SHAP可解释分析显示,衰弱的预测因子重要性排序依次为:认知障碍、查尔斯共病指数、慢性疼痛、体育锻炼量、肌少症、营养状态、糖尿病肾病.结论 基于SHAP可解释XGBoost的衰弱预测模型可有效识别老年糖尿病患者的衰弱高风险因素,能为其健康管理策略提供支持.
更多相关知识
- 浏览10
- 被引0
- 下载8

相似文献
- 中文期刊
- 外文期刊
- 学位论文
- 会议论文


换一批



