基于机器学习方法构建幽门螺杆菌感染的风险预测模型
Construction of the risk prediction model of Helicobacter pylori infection based on Machine learning method
摘要目的 基于幽门螺杆菌(Hp)感染的相关因素,构建Hp感染的风险预测模型,为临床预防Hp感染提供新方法.方法 对石河子大学第一附属医院消化内科门诊行 13C、14C尿素呼气试验的检测者,使用问卷调查本地Hp感染现状.按 7∶3 随机将数据集分成训练集和测试集,以是否发生Hp感染为结局变量,采用单因素分析和多因素Logistic回归分析筛选出有统计学差异的特征变量.在训练集中,使用支持向量(SVM)、K邻近(KNN)、逻辑回归(LR)模型、随机森林(RF)、极限梯度提升(XGB)和轻量级梯度提升(LightGBM)6种机器学习方法构建Hp感染风险预测模型,并在测试集进行验证与评价,通过各模型间预测性能对比,筛选出最佳模型.应用Shapley加法解释(SHAP)方法对最佳模型进行可解释性分析.结果 本次调查人群 678 人,其中训练集 475 人、测试集 203 人,XGB模型准确率为 0.784,精确率为 0.777,召回率为 0.783,F1 值为 0.780,精确准-召回曲线的曲线下面积(AUPRC)为 0.875、受试者工作特征曲线下面积(AUC)为 0.885、Brier值为 0.140,为最佳预测模型.基于XGB模型对特征变量进行重要性排序,依次为Hp认知评分、喜食高盐高脂食物、共用牙杯水杯等生活用品、进食腌制食物、进食生大蒜.结论 基于XGB机器学习方法构建的Hp感染风险预测模型最佳,有助于临床早期评估和预防Hp感染风险的发生.
更多相关知识
- 浏览13
- 被引0
- 下载18

相似文献
- 中文期刊
- 外文期刊
- 学位论文
- 会议论文


换一批



