摘要糖尿病是世界各国面临的影响人们健康的主要挑战之一。而孕期糖尿病作为糖尿病中比较特殊的一种,其患病率也在逐年提高,严重危害了母体和胎儿的健康,影响了社会的发展,对于孕期糖尿病的预防和预测也越来越受到卫生界的关注。近几年快速发展的机器学习技术可以为解决这个问题提供新的思路。本文的研究目的是运用集成学习的方法对孕期糖尿病进行精准预测,研究问题所采用的1000个孕期糖尿病数据由阿里云联合青梧桐健康科技有限公司主办天池精准医疗大赛——人工智能辅助糖尿病遗传风险预测提供。首先对数据进行预处理和特征选择,分析比较包裹式和嵌入式两种特征选择方法,结果表明包裹式方法优于嵌入式方法。然后采用两种单分类器模型决策树和逻辑回归,以及两种集成分类器随机森林和xgboost对处理后的数据进行建模预测,根据F1值,召回率和ROC曲线找到预测效果最好的模型为xgboost,其次是随机森林。并且运用简单平均,加权平均和stacking对四个分类器进行了模型融合,其中stacking算法效果最好,其次是熵权法。同时发现,VAR00007过高、年龄过大、肥胖、怀孕次数过多、舒张压过高属于孕期糖尿病的高危因素。
更多相关知识
- 浏览3
- 被引3
- 下载10

相似文献
- 中文期刊
- 外文期刊
- 学位论文
- 会议论文


换一批



