基于生物信息学和机器学习鉴定慢性阻塞性肺病合并肺动脉高压标志物及实验验证
Identification and experimental validation of biomarkers for chronic obstructive pulmonary disease complicated with pulmonary arterial hypertension based on bioinformatics and machine learning
摘要目的 利用生物信息学筛选诊断慢性阻塞性肺病(chronic obstructive pulmonary disease,COPD)合并肺动脉高压(pulmonary arterial hypertension,PAH)的关键生物标志物,并验证其临床意义.方法 通过高通量测序数据分析鉴定了COPD合并PAH的差异表达基因(differentially expressed genes,DEGs),并通过功能富集分析探讨了这些基因的生物学功能.利用最小绝对收缩与选择算子(least absolute shrinkage and selection operator,LASSO)、随机森林(random forest,RF)、支持向量机递归特征消除(support vector machine-recursive feature elimination,SVM-RFE)机器学习方法筛选出5个潜在的生物标志物.通过单细胞分析揭示了关键基因在巨噬细胞中的表达模式.提取肺组织巨噬细胞进行细胞水平验证,观察肺PAH关键生物标志物表达差异.通过外周血单个核细胞(peripheral blood mononuclear cells,PBMC)数据验证关键生物标志物临床意义.利用缺氧方法建立COPD合并PAH小鼠模型,将16只8周龄普通级COPD小鼠(雌雄不限,体质量20~22 g)按随机数字抽样法分为(n=8):缺氧组(氧浓度为10%±0.5%,COPD合并PAH组)和常氧组(COPD组).使用免疫荧光技术标记关键生物标志物,计算表达情况.结果 COPD合并PAH 筛选出28个DEGs(|Log2FC|≥2,P<0.05).功能富集分析显示,COPD合并PAH的DEGs与主要组织相容性复合体(majorhistocompatibility complex,MHC)Ⅱ和细胞分裂相关,参与溶酶体、氧化磷酸化及细胞周期通路(P<0.05).机器学习得到5个潜在的生物标志物(GRN、KLF4、SHTN1、LRP1和GPNMB),进一步的单细胞分析揭示了这些标志物在疾病发展中存在逆向表达模式.从PBMCs中构建的诺模图模型,用于诊断COPD合并PAH[受试者操作曲线下面积(area under the subject curve,AUC)为0.907].COPD合并PAH组GRN、KLF4、SHTN1、LRP1和GPNMB蛋白和基因显著高表达(P<0.05).结论 本研究发现了GRN、KLF4、SHTN1、LRP1和GPNMB可作为COPD合并PAH预测和诊断的关键生物标志物,为COPD合并PAH的临床治疗提供了新的见解.
更多相关知识
- 浏览23
- 被引0
- 下载22

相似文献
- 中文期刊
- 外文期刊
- 学位论文
- 会议论文


换一批



