基于通路关联深度神经网络急性肾损伤生物信息学分析
Bioinformatics analysis of acute kidney injury based on pathway-associated deep neural network
摘要目的 利用通路关联深度神经网络和多种机器学习算法筛选不同病因急性肾损伤(AKI)共同的关键基因和重要通路.方法 将从基因表达汇编(GEO)数据库下载的AKI微阵列数据集GSE30718、GSE37838、GSE53769、GSE108113、GSE125779、GSE99325、GSE174020 进行合并,包括 60 个AKI患者肾脏样本和 79 个健康对照肾脏样本,按 8∶2 比例划分为训练集和测试集,用于通路关联深度神经网络以及最小绝对收缩和选择算子(LASSO)、随机森林(RF)、支持向量机(SVM)-递归特征消除(RFE)、极限梯度提升树(XgBoost)4 种机器学习算法的训练和评估,以筛选不同病因AKI的共同关键基因和通路.将下载的数据集GSE99340、GSE1563 进行合并,包括 43 个AKI患者肾脏样本和 36 个健康对照肾脏样本,作为外部验证集用于基于最终筛选基因的LASSO模型和列线图性能测试.采用ROC曲线、精确度、召回率、准确度、F1 分数对通路关联深度神经网络和机器学习算法进行评估.对AKI转录组数据进行CIBERSORT免疫细胞浸润评估,并对最终筛选的共同关键基因与免疫细胞浸润水平进行Pearson相关分析.结果 5 折交叉验证训练的通路关联深度神经网络在测试集中的AUC为 0.914 5±0.007 0,精确度为 0.750 0±0.044 0,召回率为 0.923 1±0.048 0,准确度为 0.838 7±0.016 0,F1 分数为 0.827 6±0.020 0,对AKI产生了稳健且高精度的分类性能,并识别了关键通路和候选基因子集.4种机器学习算法在测试集的AUC≥0.860,精确度≥0.750,召回率≥0.800,F1 分数≥0.774,均实现了对AKI的高判别性能,并筛选出 7 个不同病因AKI的共同关键基因,分别为CD86、C-X-C基序趋化因子配体10(CXCL10)、发动蛋白2(DNM2)、原癌基因FOS、转录因子 12(TCF12)、VGF神经生长因子诱导蛋白(VGF)、A激酶锚定蛋白 5(AKAP5).基于最终筛选基因的LASSO模型测试集AUC为0.940 4,外部验证AUC为0.944 4,模型对AKI样本表现出极高的鉴别能力,证明了基因的整体调控性能.基于筛选的 7 个基因构建的列线图具有较高的分类性能,AUC为 0.928 9,验证了筛选的个体基因的突出贡献和整体作用.免疫细胞浸润分析显示初始B细胞、活化的肥大细胞、单核细胞、M1型巨噬细胞、记忆B细胞、活化的树突状细胞在AKI样本和健康对照样本间差异有统计学意义(均P<0.05).M1 型巨噬细胞、单核细胞与CD86、CXCL10呈正相关,活化的肥大细胞与FOS呈正相关,初始B细胞与CD86、CXCL10呈负相关(均P<0.01).活化的肥大细胞与VGF呈正相关、与CD86和TCF12呈负相关,而记忆B细胞与CD86呈正相关(均P<0.05).结论 结合通路关联深度神经网络和多机器学习分类器策略能从高维、复杂异质的转录组数据中挖掘具有高价值的关键基因,可作为AKI潜在的治疗干预靶点.
更多相关知识
- 浏览5
- 被引0
- 下载5

相似文献
- 中文期刊
- 外文期刊
- 学位论文
- 会议论文


换一批



