基于GEO数据库筛选活动性结核病胞葬作用相关关键基因的研究
Identification of efferocytosis-related core genes in active tuberculosis patients based on GEO database
摘要目的:筛选与胞葬作用相关的基因作为区分活动性结核病(active tuberculosis,ATB)与结核分枝杆菌潜伏感染(latent tuberculosis infection,LTBI)的生物标志物.方法:从GEO数据库下载由46例ATB患者和25名LTBI人群外周血微阵列芯片数据所组成的数据集(GSE28623),采用R语言的limma包,筛选差异表达基因(differentially expressed genes,DEGs);采用CIBERSORT包进行免疫浸润分析,评估ATB患者和LTBI人群免疫浸润状态;对在ATB患者中上调的基因进行基因本体论(GO)及京都基因和基因组百科全书(KEGG)信号通路分析;通过对DEGs与胞葬作用相关基因集取交集,筛选胞葬作用相关差异基因(efferocytosis-related differentially expressed genes,EF-DEGs)进行LASSO回归和SVM-RFE机器学习,筛选ATB关键基因.最后使用数据集GSE101705进一步验证关键基因的表达量,并通过绘制受试者工作特征曲线(receiver operating characteristic,ROC)评估关键基因区分ATB和LTBI的能力.结果:通过差异分析,识别出460个上调差异表达基因和991个下调差异表达基因;免疫浸润提示,ATB患者中性粒细胞(P=1.45×10-7)和M0巨噬细胞(P=7.55× 10-6)比例明显升高,而初始CD4+T细胞(P=0.003)、CD8+T细胞(P=1.45×10-7)和初始B细胞(P=0.026)等细胞比例明显下降;GO富集分析结果显示,ATB中上调的DEGs在生物过程中主要富集在对细菌来源分子的反应、脂多糖反应和髓系白细胞活化等信号通路;在细胞组分上主要定位在分泌颗粒腔、胞质囊泡腔和囊泡腔等;在分子功能方面主要涉及免疫受体活性、模式识别受体活性和脂多糖结合等方面.KEGG富集通路分析发现,ATB上调DEGs主要参与了脂质和动脉粥样硬化、胞葬作用和NOD样受体信号通路等多条信号通路;通过DEGs与胞葬作用基因列表取交集,筛选到 13 个 EF-DEGs(PROS1、SIAH2、CD274、WDFY3、SCARF1、ABCA1、DYNLT1、FPR2、CLU、IL1B、TNFSF13B、ITGB3、PLAUR).利用LASSO回归和SVM-RFE机器学习进行关键基因筛选并取交集,筛选出CD274、PROS1和SIAH2作为ATB关键基因;通过外部数据集GSE101705进一步验证显示,CD274、PROS1和SIAH2在ATB患者外周血表达量显著高于LTBI,并且三者鉴别ATB的ROC曲线下面积(area under the curve,AUC)分别达到 89.5%(95%CI:79.9%~99.1%)、88.4%(95%CI:78.7%~98.1%)和 79.0%(95%CI:64.6%~93.5%),三者联合鉴别ATB的AUC值达到93.6%(95%CI:86.5%~100.0%).结论:基于公共数据库对ATB患者和LTBI人群外周血基因表达水平进行分析,发现CD274、PROS1和SIAH2具有较好的鉴别价值,是潜在的ATB鉴别的生物标志物.
更多相关知识
- 浏览2
- 被引0
- 下载2

相似文献
- 中文期刊
- 外文期刊
- 学位论文
- 会议论文


换一批



