基于机器学习算法探讨甲状腺相关性眼病的免疫相关基因
Exploration of immune-related genes of thyroid-associated ophthalmopathy based on machine learning algorithm
摘要目的 通过机器学习算法探讨甲状腺相关性眼病(TAO)的免疫相关基因.方法 从GEO数据库下载TAO相关基因芯片数据集,共获得24 例正常对照者(正常对照组)的样本和27 例TAO患者(TAO组)的样本.利用R4.2.1 软件对两组样本数据进行分析以筛选差异表达基因(DEGs),然后进行DEGs的基因本体论(GO)功能富集分析、京都基因与基因组百科全书(KEGG)通路富集分析、疾病本体(DO)富集分析.通过基因集富集分析识别两组之间差异最显著的信号通路.利用最小绝对值收敛和选择算子(LASSO)算法及支持向量机-递归特征消除(SVM-RFE)算法在DEGs中筛选对TAO具有潜在诊断价值的特征性基因并取交集,通过受试者工作特征曲线评价最佳特征性基因的诊断效能.利用CIBERSORT反卷积算法分析22 种免疫细胞在两组样本中的浸润情况,分析诊断效能较高的最佳特征性基因与免疫细胞的相关性.结果 共得到 20 个DEGs.GO功能富集分析结果显示,DEGs涉及的生物过程包括骨骼肌细胞分化、细胞趋化过程等,涉及的细胞组分包括分泌颗粒管腔及囊腔等,涉及的分子功能包括多种受体结合等.KEGG 通路富集分析结果显示,DEGs主要富集在白细胞介素17 信号通路等.DO富集分析结果显示,DEGs富集的疾病包括关节炎、淋巴结疾病和川崎病等.基因集富集分析结果显示,与正常组相比,TAO组中的基因主要富集在与溶酶体、氧化磷酸化、氨基糖和核苷酸糖的代谢、N聚糖生物合成相关的信号通路及过氧化物酶体增殖物激活受体信号通路中.对LASSO算法和SVM-RFE算法的结果取交集后,共获得6 个最佳特征性基因,其中MPEG1 的mRNA表达量对TAO的诊断效能最高(曲线下面积为0.889).TAO组的CD4+幼稚T淋巴细胞、滤泡辅助性T淋巴细胞、单核细胞、M0 型巨噬细胞、激活的肥大细胞及中性粒细胞占比均高于正常对照组,而M2 型巨噬细胞和静息的肥大细胞的占比均低于正常对照组(均P<0.05).MPEG1 的mRNA表达量与M0 型巨噬细胞、激活的肥大细胞、单核细胞、CD4+幼稚T淋巴细胞和滤泡辅助性T淋巴细胞的占比呈负相关,与M2 型巨噬细胞和静息的肥大细胞的占比呈正相关(均P<0.05).结论 MPEG1 可能可以作为TAO发病的潜在特征性基因,与免疫细胞共同参与TAO的生理病理过程.
更多相关知识
- 浏览72
- 被引1
- 下载26

相似文献
- 中文期刊
- 外文期刊
- 学位论文
- 会议论文


换一批



