您的账号已在其他设备登录,您当前账号已强迫下线,
如非您本人操作,建议您在会员中心进行密码修改

确定

胶质瘤多组学数据库构建和基于外周血转录组的乳腺癌检测研究

摘要:

近年来高通量组学检测技术的持续发展为精准医学的进步提供了源源不断的动力,使得生物医学由单纯的实验驱动变为实验加数据共同驱动的学科。在此背景下,基因组、转录组、表观组、蛋白组等组学数据成爆发式增长,据测算2017年度中国组学数据产出量为20PB,但这些数据中只有约128TB提交到数据中心,而且提交之后也只是作为资源被动地存放,缺乏有效、及时的审编,因此也严重限制了海量数据的整合和挖掘,成为当前精准医学发展面临的一项重要挑战。本论文将围绕多维组学、临床数据和药物基因组学的审编、整合,并在此基础上进行深度挖掘研究,具体包括以下两方面的内容:<br>  (一)胶质瘤多维组学数据库建设。胶质瘤是人类面临的最恶性的肿瘤之一,目前已有多项针对胶质瘤的组学研究,但数据分散,缺乏深度审编,至今仍没有一个针对胶质瘤的多组学数据库。本研究中,通过论文和数据检索,整合基因组变异、基因表达谱、microRNA(miRNA)表达谱、DNA甲基化、靶向用药等信息,涉及测序、芯片等多种平台,系统整理了胶质瘤领域的数据,形成一个统一的数据展示和搜索平台,并在此基础上针对现有数据进行了分析挖掘:计算多个数据集中基因表达相关性系数;预测胶质瘤中潜在的基因调控网络并实现交互式的网络展示;整合病人信息和基因表达量,形成在线的生存分析工具,支持单因素(基因)和多因素的分析和可视化;整合突变、拷贝数变异(copy number alteration,CNA)、表达等数据,实现多组学交互式热图可视化;整合突变、药物基因组信息,形成在线的靶向药物比对工具,实现基于个体突变信息的靶向药物推荐功能;还设计了针对GEO数据库的自动检索、更新工具,保证数据的及时更新。综上,整合多组学数据的存储、检索、数据分析,建成胶质瘤综合数据库GliomaDB,为胶质瘤领域的科研和临床工作者提供了丰富的数据资源和在线分析平台。<br>  (二)中国每年因乳腺癌死亡人数超7万,居于女性恶性肿瘤发病率首位。由于其发病机制尚不清楚,目前仍缺乏可用于临床早期诊断的精准分子标记。临床医生通常通过钼靶X线等手段来做早期乳腺癌的筛查,但这在更早期以及具有高密度腺体的女性群体中准确性不高,使得很多患者确诊时已是晚期,错过了最佳治疗时期。在分子层面,目前研究比较多的是基于外周血循环肿瘤DNA(ctDNA)的检测,但外周血中肿瘤DNA含量极低,尤其是在肿瘤发生早期,ctDNA的比例甚至已经低于测序的错误率,给检测带来极大的挑战,另外由于种族差异,找到具有普适性的代表肿瘤DNA的突变也是一大挑战。近年来,基于外周血转录组的乳腺癌检测提供了另外一个思路,利用肿瘤系统性疾病的特征从转录角度入手,避免了ctDNA含量低、突变种族特异性的缺点,在一些独立的研究中取得了不错的效果。但表达谱受平台差异和批次效应影响较大,使得目前的方法不具有普遍意义,基于此提出了基于表达量秩序的标准化方法,将绝对的基因表达量转换为两两基因之间的大小关系,并在此基础上整合来自不同平台、不同批次的肿瘤病人和健康人外周血表达谱数据,通过机器学习的方法构建分类模型,实现了在跨平台数据集中85%的准确率和0.90的AUC(Area Under the Curve)。在此基础上,整合模型形成在线预测工具rankDetect,支持用户上传表达量文件,返回每个样本的预测结果。还在预测结果页面设置反馈选项,收集用户对预测结果的准确性评价,以进一步提高模型的准确性。

更多
作者: 杨亚东
导师: 方向东
学位信息:
中国科学院大学 基础医学 基因组学(博士) 2018年
分类号: R739.41R737.9
发布时间: 2018-12-13
  • 浏览:12
  • 下载:0

加载中!

相似文献

  • 中文期刊
  • 外文期刊
  • 学位论文
  • 会议论文

加载中!

加载中!

加载中!

加载中!