基于机器学习算法的高校教职工非酒精性脂肪肝预测模型研究
Research on the prediction model of non-alcoholic fatty liver disease among university faculty based on machine learning algorithms
摘要目的:利用常见的机器学习算法建立基于常规体检指标的高校教职工人群的非酒精性脂肪肝风险预测模型,以便更精准地评估和管理高风险人群.方法:本研究利用在2021和2022年连续两年在山东第一医科大学第一附属医院进行体检的高校教职工群体作为研究对象.利用人口基线信息、血常规、肝功能十二项、空腹血糖、血脂四项、肾功能三项和癌胚抗原共36个体检指标,使用逻辑回归、k-近邻、多层感知机神经网络、决策树、随机森林、LightGBM、XGBoost、AdaBoost、CatBoost、梯度增强决策树共10个机器学习算法构建非酒精性脂肪肝风险预测模型,并通过受试者工作特征曲线、准确性、阳性预测值、阴性预测中和F1评分评估模型,选取最优预测模型,并基于Shapley加法解释值的递归特征消除算法识别模型重要特征.结果:本研究共纳入3 150名研究对象,其中623名在2022年被诊断为非酒精性脂肪肝.通过LASSO回归算法筛选出19个预测变量,构建的10个机器学习预测模型中LightGBM模型具有最佳的预测性能AUC为0.854以及具有最高的AUC、NPV和F1-Score,经过进一步调优后AUC变为0.860,预测性能良好.研究发现,体质量指数、甘油三酯、谷丙转氨酶、年龄、低密度脂蛋白胆固醇和空腹血糖是排名前六位的非酒精性脂肪肝的主要危险因素.结论:基于19个体检指标建立的高校教职工人群的非酒精性脂肪肝LightGBM风险预测模型表现良好,可以准确地评估疾病发生风险.
更多相关知识
- 浏览3
- 被引1
- 下载3

相似文献
- 中文期刊
- 外文期刊
- 学位论文
- 会议论文


换一批



