肠道宏基因组图像增强和深度学习改善代谢性疾病分类预测精度
Gut metagenome-derived image augmentation and deep learning improve prediction accuracy of metabolic disease classification
摘要近年来,统计学和机器学习方法被广泛用于分析人体肠道微生物宏基因组与代谢性疾病之间的关系,这对于微生物群落的功能注释和开发具有重要意义.本研究提出了一种新的可推广的肠道宏基因组图像增强和深度学习框架,用于人类代谢性疾病的分类预测.将3个代表性人类肠道宏基因组数据集中的每个数据样本分别转换为图像并进行数据增强,输入逻辑回归(logistic regression,LR)、支持向量机(support vector machine,SVM)、贝叶斯网络(Bayesian network,BN)和随机森林(random forest,RF)机器学习模型以及多层感知机(muti-layer perception,MLP)和卷积神经网络(convolutional neural network,CNN)深度学习模型.使用准确率(accuracy,A)、精确率(precession,P)、召回率(recall,R)、Fl 分数(Fl-score)和 ROC(receiver operating characteristic)曲线下面积(area under the curve,AUC)5个指标以及10折交叉验证整体评估模型疾病预测的精度性能.结果显示:MLP模型的整体表现优于CNN、LR、SVM、BN、RF以及PopPhy-CNN方法,且经过数据增强(随机旋转和添加椒盐噪声)后,MLP和CNN的模型性能均有进一步提升.MLP模型进行疾病预测的准确率进一步提高了 4%~11%,F1提高了 1%~6%,AUC提高了 5%~10%.以上结果表明,人类肠道宏基因组图像增强和深度学习可以准确地提取微生物群特征,有效预测宿主疾病表型.本研究中使用的源代码和数据集均公开发表在Github中:https://github.com/HuaXWu/GM_ML_Classification.git.
更多相关知识
- 浏览8
- 被引2
- 下载4

相似文献
- 中文期刊
- 外文期刊
- 学位论文
- 会议论文


换一批



