摘要急性T淋巴细胞白血病(T-cell acute lymphoblastic leukemia,T-ALL)是一种常见的儿童恶性肿瘤疾病,其易浸润中枢神经系统,危险等级高,复发率高,已成为国内外的研究热点。T-ALL的发生发展是多种因素共同作用的结果,其发病机制目前尚未明确。随着不同层面组学数据的大量涌现,融合多组学数据的生物信息学方法为探索T-ALL的发病机制、深入阐释T-ALL中的基因调控机制提供了一种新途径,具有重要的学术价值和广泛的应用前景。<br> DNA甲基化和CCCTC结合因子(CCCTC-binding factor,CTCF)构成了一个复杂的调控系统,其对T-ALL中的基因表达起着关键性的调控作用。本研究融合T-ALL的全基因组RNA-seq、CTCF ChIP-seq及DNA甲基化数据,采用生物信息学方法筛选T-ALL患者与健康人T细胞之间的差异基因,通过基因相似性融合网络和蛋白质相互作用网络筛选出其中的关键基因及核心基因,这些核心基因有成为T-ALL生物标志物的巨大潜力。本文主要包括以下研究内容:<br> 首先,从GEO和SRA数据库中下载与T-ALL相关的RNA-seq、CTCF ChIP-seq及DNA甲基化数据集,运用DESeq2和edgeR方法从RNA-seq数据集中筛选出5887个差异基因、从ChIP-seq数据集中筛选出5315个差异基因,运用CHAMP软件从DNA甲基化数据集中筛选出2196个差异基因,三组差异基因集取交集后共得到119个共有差异基因。<br> 其次,针对共有差异基因,依次构建相应单组学数据下的相似性网络,并经多次迭代后得到融合网络。整合融合网络并对基因排序,获得每个基因的重要性。结合共识聚类方法,确定119个差异基因在转录组与DNA甲基化数据集中的最佳聚类数,统计每类中的相同基因与所有基因的个数及重要性,筛选出相互作用多且强的48个关键基因。<br> 最后,对关键基因进行序列的相似性分析,以及GO和KEGG通路的功能富集分析,使用STRING数据库构建其对应的蛋白质相互作用网络,借助Cytoscape软件筛选出11个核心基因。通过检索三个数据库(MalaCards、CGC和CTD)进行验证,结果表明8个核心基因与T-ALL密切相关,3个核心基因虽未有报道,但具有成为T-ALL生物标志物的潜力,为探索T-ALL的发病机制和精准诊疗提供了有价值的信息。
更多相关知识
- 浏览2
- 被引0
- 下载1
相似文献
- 中文期刊
- 外文期刊
- 学位论文
- 会议论文