预测新冠病毒感染患者有无症状的机器学习模型的构建与验证
Development and validation of a machine learning model to predict the symptomatic status of COVID-19 patients
摘要目的 为科学合理分配医疗资源,提高救治率,探讨机器学习算法用于预测新冠病毒感染后是否出现症状的效果.方法 回顾性收集2022年12月至2023年2月在某三甲医院确诊为新冠病毒感染患者的临床信息,并随机分为训练集(75%)和测试集(25%).采用单因素logistic分析及最小绝对收缩和选择算子(LASSO)算法筛选出特征变量.采用 fully connected deep neural network(FCDNN)、distributed random forest(DRF)、gradient boosting machine(GBM)以及generalized linear model(GLM)4种机器学习分类器,在训练集中进行模型的构建,并在验证集中验证最佳模型.采用受试者工作特征(ROC)曲线下面积(AUC)、逻辑回归损失(Logloss)、均方根误差(RMSE)和均方误差(MSE)评价机器学习的模型效能.应用基尼指数评价最优模型特征变量的重要性.结果 共251例患者纳入分析,其中训练集154例,验证集97例.经单因素logistic分析和LASSO计算后,筛选出年龄、长期饮酒史、睡眠欠佳比率、进食欠佳比率、糖尿病患病率、高血压患病率、其他疾病患病率、基础用药率、其他用药率、呼吸频率以及新冠病毒N基因的CT值等11个特征变量构建机器学习预测模型.4个机器学习模型中,GBM模型的AUC最高,而Logloss、RMSE、MSE最低,GBM模型在训练集和验证集中的AUC分别为0.878 0、0.793 3.采用基尼指数评价特征变量的重要性,结果显示变量的重要性依次为N基因CT值、年龄、患其他疾病、呼吸频率、患高血压或糖尿病、长期饮酒史、进食欠佳和睡眠欠佳.结论 本研究开发并验证了一个GBM预测模型,在预测新冠病毒感染后有无症状上具有良好效能,能为患者后续的诊疗策略制定和医疗资源的分配提供重要参考.
更多相关知识
- 浏览23
- 被引0
- 下载6

相似文献
- 中文期刊
- 外文期刊
- 学位论文
- 会议论文


换一批



