高原脱适应症发生风险预测模型的构建与验证
Construction and validation of a risk prediction model for high altitude de-acclimatization syndrome
摘要目的 应用不同机器学习算法构建从高原返回平原人群高原脱适应症(high altitude de-acclimatization syndrome,HADAS)发病的风险预测模型,并验证其预测效能.方法 于2020年11月至2024年2月对结束高原生活返回内地的人群实地或线上发放问卷调查.收集基本资料、慢性高原病(chronic mountain sickness,CMS)情况和脱适应症状等调查资料,经筛选最终纳入1 095例作为建模组.阳性事件定义为脱适应症状评分>5分.将建模组按7∶3随机分为训练集(n=766)和内部测试集(n=329),采用最小绝对收缩和选择算子(least absolute shrinkage and selection operator,LASSO)回归筛选自变量,基于多因素Logistic回归(multiple factor logistic regression,LR)、决策树(decision tree,DT)、随机森林(random forest,RF)、极端梯度提升(eXtreme gradient boosting,XGB)、支持向量机(support vector machine,SVM)、K最邻近(K-nearest neighbor,KNN)、轻度梯度提升(light gradient boosting,LGB)、朴素贝叶斯(na?ve bayes,NB)8种机器学习方法构建预测模型.采用受试者工作特性曲线(receiver operating characteristic,ROC)、校准曲线和混淆矩阵对模型进行比较并进行内部测试;使用列线图或Shapley加性解释(shapley additive explanations,SHAP)图对最终模型进行展示.于2024年8月收集筛选结束高原生活返回平原132例作为外部验证组,对模型进行外部验证.结果 1 095例调查人群中有脱适应症者549人(50.14%).CMS评分、年龄、高原居住时间为LASSO回归筛选出的预测因子.8种机器学习算法建立的HADAS预测模型中,以LR模型最优,ROC的曲线下面积(area under curve,AUC)训练集为0.819(95%CI:0.789~0.850),内部测试集为0.841(95%CI:0.799~0.884),F1评分内部测试集为0.801,内部测试集的AUC、F1得分在8个模型中均为最大;LR模型校准曲线的Spiegelhalter Z检验显示训练集P=0.703、内部测试集P=0.281;LR模型外部验证集AUC为0.867(95%CI:0.765~0.969).结论 以CMS评分、年龄和高原居住时间为预测因子建立的LR模型在内部测试集的综合表现最好,在外部验证集中区分度好,构建的列线图便于应用.
更多相关知识
- 浏览3
- 被引0
- 下载2

相似文献
- 中文期刊
- 外文期刊
- 学位论文
- 会议论文