基于机器学习和logistic回归分析探究老年人死亡的影响因素
Influencing Factors of Elderly Death Based on Machine Learning and Logistic Regression Analysis
摘要目的 探讨中国老年人死亡风险因素,并构建个体化风险预测模型.方法 采用2015-2020年中国健康与养老追踪调查(CHARLS)数据,以老年人为研究对象,收集相应的人口学、生活方式、疾病史和体格检查相关信息,将数据集随机分为训练集和验证集(7∶3),运用逻辑回归、随机森林、极端梯度提升(XGBoost)3种分类算法建立老年人死亡预测模型,并选出最佳模型进行可解释性分析.结果 共纳入5 505例研究对象,其中死亡人数为977人.3种模型预测结果显示XGBoost模型具有较好的预测效果(曲线下面积为0.756,95%CI:0.720~0.792),夏普利值分解方法(SHAP)结果显示体重指数、年龄、性别、受教育程度、婚姻状况是老年人死亡的前5位危险因素.结论 XGBoost模型对老年人死亡风险有良好的预测效果,SHAP模型对个体化死亡风险预测提供明确解释.
更多相关知识
- 浏览10
- 被引0
- 下载6

相似文献
- 中文期刊
- 外文期刊
- 学位论文
- 会议论文


换一批



