基于健康体检数据的结直肠息肉风险预测模型的构建与评估
Construction and evaluation of a risk prediction model for colorectal pol-yps based on physical examination data
摘要目的:探讨结直肠息肉的影响因素并构建早期风险预测模型.方法:收集2016 年11 月至2021 年10 月于郑州大学第一附属医院健康管理中心同时进行结肠镜检查和血常规、生化指标检查的4 997 名受检者资料,包括22 项指标,使用最小绝对收缩选择算子(LASSO)进行特征变量筛选.按7∶3 随机分组,在训练集中采用得到的最优变量构建梯度提升(Catboost)、支持向量机(SVM)、Logistic回归(LR)预测模型,在测试集中进行验证.采用χ2检验比较3 种模型的准确率,进一步通过净重新分类指数(NRI)、综合判别改善指数(IDI)、ROC 曲线下面积(AUC)评估模型的预测性能,并对纳入因素进行重要性评估.结果:LASSO回归得到性别、年龄、腰围(WC)、尿素(BU)、总蛋白(TP)、肾小球滤过率(GFR)、甘油三酯葡萄糖指数(TyG)等7 项特征变量,基于该7 项特征变量构建的SVM、Catboost模型的准确率优于LR模型(P<0.05).SVM、Catboost、LR模型测试集的AUC(95%CI)分别为0.760(0.736~0.784)、0.766(0.742~0.790)和 0.676(0.649~0.703).进一步评估显示SVM模型预测效果最优,Catboost次之,LR 最差(SVM vs Catboost/LR:NRI>0,IDI>0,P<0.05;Catboost vs LR:NRI>0,IDI>0,P<0.001).特征重要性评估显示年龄的重要性最大,其次是WC.结论:基于性别、年龄、WC、BU、TP、GFR、TyG构建的SVM模型具备较好的预测价值.该预测模型的建立可对健康体检人群进行危险分层,有助于尽早发现结直肠癌早期病变.
更多相关知识
- 浏览111
- 被引0
- 下载63

相似文献
- 中文期刊
- 外文期刊
- 学位论文
- 会议论文