基于GEO数据库筛选结核病关键基因及信号通路的研究
Screening of core genes and pathways involved in tuberculosis onset based on GEO database
摘要目的:利用生物信息学方法鉴定结核病表达差异基因及相关信号通路,以发现可用于结核病诊断的生物标志物.方法:从高通量基因表达数据库(GEO)中搜索结核病患者样本及健康人群的基因表达芯片数据集,下载GSE139825基因芯片微阵列数据集作为分析数据集,使用R语言中的limma包对测序数据进行标准化校正和鉴定差异基因(DEGs),使用clusterProfiler包进行基因本体论(GO)及京都基因和基因组百科全书(KEGG)信号通路分析.使用STRING在线数据库进行差异基因的蛋白互作网络(PPI)分析并用Cytoscape软件进行可视化和筛选核心基因.下载GSE19439基因芯片微阵列数据集作为表达差异的核心基因的验证数据集,同时使用酶联免疫吸附试验验证候选生物标记物,并使用受试者工作特征曲线下面积(AUC)评估其诊断能力.结果:通过分析GSE139825数据库共筛选出206个差异基因,其中172个基因表达上调,34个基因表达下调,其中,下调50%以上的基因有PDK4和CABLES1,上调8倍以上的有IL1B、LOC728835、CXCL10和IL8.GO和KEGG分析表明,差异基因的生物过程主要集中在细胞因子介导的信号通路、白细胞细胞间黏附、对脂多糖的应答反应等方面,主要发挥细胞因子受体结合、细胞因子的活性等分子功能,并在细胞因子之间的相互作用、TNF信号通路、结核病相关通路等信号通路上富集显著.PPI分析鉴定出10个核心基因,分别为IL1B、TNF、IL6、IL1A、CCL20、CXCL1、CXCL10、CXCL8、CCL3和CCR7.通过GSE19439验证数据集分析,发现10个核心基因中CXCL10和IL1同样表达上调;酶联免疫吸附实验验证也发现健康对照和结核病患者的CXCL10蛋白的ELISA平均值分别为0.570和 0.827,IL1B蛋白分别为 1.245 和 2.067,差异均有统计学意义(t=25.353,P<0.001;t=11.840,P=0.002);logistic回归模型分析显示,CXCL10和IL1B在区分健康组和结核病组方面均表现良好(AUCCXCL10=0.854,AUCIL1B=0.818).结论:研究揭示了结核病发病相关基因间的相关作用,发现CXCL10和IL1B均能较好的区分健康对照和结核病患者,可作为新型结核病诊断的生物标志物.
更多相关知识
- 浏览17
- 被引0
- 下载8

相似文献
- 中文期刊
- 外文期刊
- 学位论文
- 会议论文


换一批



