基于心脑血管疾病发病风险预测的CatBoost算法和贝叶斯网络模型分析
CatBoost algorithm and Bayesian network model analysis based on risk prediction of cardiovascular and cerebro vascular diseases
摘要目的:筛选影响心脑血管疾病发病的主要特征变量,基于排序前10位的特征变量构建心脑血管疾病发病风险贝叶斯网络模型,为心脑血管疾病发病风险预测提供参考.方法:从英国生物样本(UK Biobank)数据库中纳入315 896例参与者和相关变量,通过类别型特征提升(CatBoost)算法进行特征选择,将所有参与者按7∶3比例随机分为训练集和测试集,并基于最大最小爬山(MMHC)算法构建贝叶斯网络模型.结果:本研究中人群心脑血管疾病患病率为28.8%.CatBoost算法筛选的排名前10位变量分别为年龄、体质量指数(BMI)、低密度脂蛋白胆固醇(LDL-C)、总胆固醇(TC)、甘油三酯-葡萄糖(TyG)指数、家族史、载脂蛋白A/B比值、高密度脂蛋白胆固醇(HDL-C)、吸烟状态和性别.CatBoost训练集模型受试者工作特征(ROC)曲线下面积(AUC)为0.770,模型准确性为0.764;验证集模型AUC为0.759,模型准确性为0.763.临床效能分析,训练集阈值范围为0.06~0.85,验证集阈值范围为0.09~0.81.心脑血管疾病发病风险贝叶斯网络模型分析,年龄、性别、吸烟状态、家族史、BMI和载脂蛋白A/B比值与心脑血管疾病直接相关,是心脑血管疾病发生的重要风险因素,TyG指数、HDL-C、LDL-C和TC通过影响BMI和载脂蛋白A/B比值间接影响心脑血管疾病的发生风险.结论:控制BMI、载脂蛋白A/B比值和吸烟行为,可以降低心脑血管疾病的发病风险.贝叶斯网络模型可用于预测心脑血管疾病发病风险.
更多相关知识
- 浏览29
- 被引0
- 下载12

相似文献
- 中文期刊
- 外文期刊
- 学位论文
- 会议论文