摘要胰腺导管腺癌(PDAC)是消化系统常见的恶性肿瘤之一,恶性程度极高,对人类的健康威胁极大,其发病率和死亡率近十年呈上升趋势。了解PDAC的致病机理,对其早期诊断以及治疗都有着极其重要的意义。目前国内外针对PDAC的研究大多利用生物技术进行实验研究,这不仅成本高,工作量也巨大。此外,在PDAC中尚未发现具有高预后价值的生物标志物。本研究通过公开数据库中PDAC相关的生物信息数据,利用R语言工具和数据分析的方法,筛选出与PDAC密切相关的致癌基因,有助于为PDAC的诊断及预后提供新思路。<br> 本文主要研究结果和结论如下:<br> 1. 从美国国家生物信息中心(NCBI)的基因综合表达(GEO)数据库获取 PDAC的基因芯片表达谱数据,包括GSE46234、GSE71989、GSE15471。使用R语言中的limma 包对基因芯片表达谱数据进行预处理和差异表达分析,筛选标准为|FC|>2 且FDR<0.05。利用VennDiagram包作韦恩图后取交集得到225个共差异表达基因(co-DEGs),其中包含61 个上调基因和164 个下调基因。经过二项分布检验,确定筛选的co-DEGs区别于随机情况。<br> 2. 利用生物注释,可视化和集成发现数据库(DAVID 6.8)对筛选出来的 225 个co-DEGs 进行基因本体功能注释(Gene Ontology,GO)分析和《京都基因与基因组百科全书》(Kyoto Encyclopedia of Genes and Genomes,KEGG)通路富集分析,以FDR<0.05作为纳入标准,共得出16个具有统计学意义的结果。GO分析结果显示, co-DEGs分别在分子功能(MF)、细胞成分(CC)和生物过程(BP)三个层次富集,主要包括细胞外基质成分、钙离子结合、丝氨酸型内肽酶活性、胞外区域、胞外空间、细胞外泌体细胞外基质、胶原蛋白分解代谢、蛋白水解、信号转导和细胞黏附等过程。KEGG通路分析显示,co-DEGs主要参与蛋白质的消化与吸收、ECM受体相互作用、粘着斑、PI3K-Akt信号和靶向肿瘤细胞凋亡等通路。<br> 3. 通过使用蛋白质互作分析工具(STRING)10.0 和 Cytosape软件(3.7.2)构建蛋白质-蛋白质互作(PPI)网络,构建的PPI网络中共有181个节点,561条边。使用CytoHubba插件度量各节点的中心度,采用MCC算法筛选出10个与PDAC高度相关的候选基因,分别为:CCNB1、AURKA、NUSAP1、TOP2A、DLGAP5、DTL、MELK、RACGAP1、NEK2和KIF20A。<br> 4. 从 mRNA 转录水平和蛋白表达水平两个角度验证筛选出的候选基因,采用数据分析的方式验证候选基因的mRNA转录水平。研究结果显示,10个候选基因在肿瘤组织中的 mRNA 转录水平显著高于癌旁组织(P-value <0.05)。通过人类蛋白图谱(HPA)数据库验证候选基因的蛋白表达水平,分析结果显示,除MELK和NEK2外, CCNB1、AURKA、NUSAP1、TOP2A、DLGAP5、RACGAP1和KIF20A在肿瘤组织中的表达水平高于正常胰腺组织。<br> 5. 为研究候选基因的预后价值,利用基因表达谱数据动态分析(GEPIA)数据库对候选基因进行生存分析,分析结果显示,CCNB1、AURKA、NUSAP1、TOP2A、DLGAP5、RACGAP1和KIF20A的上调表达显著缩短了PDAC患者的生存期(Log-rank P <0.05)。下载癌症基因组图谱(TCGA)数据库中182例PADC临床信息,将患者年龄、性别、TMN分期,肿瘤分期,病理分期及上述候选基因纳入单因素和多因素Cox回归分析,结果表明,CCNB1、AURKA、NUSAP1、TOP2A、DLGAP5、RACGAP1和KIF20A可作为PADC独立预后因子(P-value<0.05)。<br> 本研究旨在利用生物信息学方法分析与PDAC增殖和预后相关的基因,为肿瘤的诊治提供新的方向。经过相关分析,最终筛选出7个关键基因,分别为CCNB1、AURKA、NUSAP1、TOP2A、DLGAP5、RACGAP1和KIF20A。它们在肿瘤组织中的显著高表达可识别PDAC的发生、转移和不良预后,有望成为PDAC诊断和预后的潜在生物标志物。
更多相关知识
- 浏览0
- 被引0
- 下载0
相似文献
- 中文期刊
- 外文期刊
- 学位论文
- 会议论文