首页 > 现代临床护理 > 基于SHAP可解释性机器学习的老年糖尿病患者衰弱风险预测模型构建与验证

基于SHAP可解释性机器学习的老年糖尿病患者衰弱风险预测模型构建与验证

Develop and validate of a SHAP-interpretable machine learning-based frailty risk prediction model for older adults with diabetes

二维码有效期 120s

摘要目的构建与验证基于可解释性机器学习的老年糖尿病患者衰弱预测模型,以早期识别高风险患者.方法采用便利抽样法,选择 2024 年 1 月至 5 月本市某三级甲等综合医院住院的 232 例老年糖尿病患者作为研究对象.227 例患者完成研究,按照 7∶3 的比例随机分为训练集(158 例)与测试集(69 例),分别用于模型构建与验证.采用最小绝对收缩和选择算子(least absolute shrinkage and selection operator,LASSO)回归与Boruta算法筛选特征变量,并基于逻辑回归(logistic regression,LR)、支持向量机(support vector machine,SVM)和极端梯度提升树(extreme gradient boosting,XGBoost)构建机器学习模型.通过曲线下面积(area under curve,AUC)、灵敏度、特异度、F1 分数等指标评估模型性能,并通过DeLong检验比较模型间的AUC差异.最优模型利用沙普利加和解释(Shapley additive explanation,SHAP)方法,对关键预测因子进行解释,并基于Streamlit开发网页计算器,实现模型可视化.结果 227 例老年糖尿病患者中 99 例合并衰弱(43.6%).XGBoost模型综合表现最优,在训练集和测试集中,DeLong检验显示XGBoost的AUC高于LR和SVM(均P<0.001).训练集AUC为 0.920,准确性为 0.842,灵敏度为 0.783,特异度为 0.887,阳性预测值(positive predictive value,PPV)为 0.845,阴性预测值(negative predictive value,NPV)为0.840,F1 分数为 0.810.测试集AUC为 0.806,准确性为 0.681,灵敏度为 0.633,特异度为 0.743,PPV为 0.731,NPV为 0.744,F1 分数为 0.620.SHAP可解释分析显示,衰弱的预测因子重要性排序依次为:认知障碍、查尔斯共病指数、慢性疼痛、体育锻炼量、肌少症、营养状态、糖尿病肾病.结论基于SHAP可解释XGBoost的衰弱预测模型可有效识别老年糖尿病患者的衰弱高风险因素,能为其健康管理策略提供支持.

作者邓舜芝 ^[1] 康圣琴 ^[2] 方苗苗 ^[1] 王雪菲 ^[3] 巫海娣 ^[4] 莫永珍 ^[5] 学术成果认领

作者单位苏州大学医学院护理学院,江苏苏州,215000 ^[1] 南京医科大学护理学院,江苏南京,210000 ^[2] 南京医科大学附属老年医院老年医学科,江苏南京,210000 ^[3] 南京医科大学附属老年医院内分泌科,江苏南京,210000 ^[4] 南京医科大学附属老年医院老年综合评估研究室,江苏南京,210000 ^[5]