甘肃省不同地区糖尿病肾脏疾病的机器学习预测模型的研究
Machine learning prediction model of diabetic kidney disease in different regions of Gansu province
摘要目的 构建甘肃省平原风沙与黄土丘陵地区T2DM患者发生DKD的机器学习(ML)预测模型,并对模型进行可解释性分析.方法 采用多阶段分层随机抽样法收集两地区T2DM患者资料,经关键特征筛选后构建 8 种DKD发生风险的ML预测模型.采用受试者工作特征(ROC)曲线下面积(AUC)、准确率及F1 指数评价模型,模型解释采用Shapley加性解释(SHAP)算法.结果 最终纳入1599 例T2DM患者,经特征筛选后平原风沙地区纳入10 个变量建模.在8 种模型中,梯度提升决策树(GBDT)模型预测效能最高,其测试集AUC为 0.972,准确率为 0.949,F1 指数为0.884.黄土丘陵地区纳入 12 个变量建模,最优模型为随机森林(RF),其测试集的AUC为 0.966,准确率为 0.951,F1 指数为 0.861.SHAP分析发现,DKD高风险除与血肌酐、年龄、LDL-C、HbA1c及DM病程等因素相关外,还与血尿酸、尿微量白蛋白相关.结论 GBDT和RF模型对两地区DKD的发生有良好预测效能,可用于两地区DKD高危人群筛查及潜在危险因素深入挖掘.
更多相关知识
- 浏览78
- 被引2
- 下载96

相似文献
- 中文期刊
- 外文期刊
- 学位论文
- 会议论文


换一批



