摘要自人类基因组计划(Human Genome Project,HGP)完成,现代生命科学研究进入了全新的系统生物学时代。这个新兴领域的诞生,代表着对生物学新方法的不断探索即将展开。科学家们逐渐认识到,对于复杂生命过程的研究不单单局限在单个基因上,而是全面系统地探索基因与基因之间的表达调控规律,揭示整个生命系统的运行机制,最终破解生命遗传的秘密。<br> 伴随着测序技术的飞快发展,各实验室的研究结果产生了海量的基因表达数据,如何利用计算方法在这些数据中挖掘出具有生物学意义的基因调控关系和调控规律成为后基因组时代人类所面临的最具挑战性的问题之一。众多用于构建调控网络的模型方法可以构建基因之间的关联关系,但是无法提供基因之间的因果关系。贝叶斯网络(Bayesian Networks,BN)模型具有扎实的理论基础以及灵活的因果推理能力,是构建调控网络的有力工具,然而目前许多基于贝叶斯网络模型的方法在网络结构搜索的过程中复杂度高,网络精确度低,难以还原复杂生命过程中的精准调控关系。随着测序技术的发展,贝叶斯网络模型与新型的单细胞测序数据结合,其优势将逐渐凸显出。本文以基因表达数据为研究对象,在总结分析贝叶斯方法构建基因调控网络研究现状的基础上,针对上述问题对目前存在的评分搜索算法进行了改进,主要完成了两部分的工作:<br> (1)提出筛选网络中关键节点基因的新方法。首先构建所有基因的共表达网络,并运用贝叶斯概率对网络中基因自身的重要性进行估算,得到基因重要性的量化表;继而利用PageRank对共表达网络中的基因由相互作用而产生的重要性传递值进行计算;最后按照重要性对关键节点进行排序。经实验验证,该方法较现有的关键节点筛选算法效果提升显著。<br> (2)设计出一种基于信息流的贝叶斯网络搜索算法。在对关键节点基因进行调控网络的构建过程中,首先计算节点之间的信息流,构造初始网络,省略搜索过程中逆转边的操作,提升搜索效率;之后利用禁忌搜索(Tabu Search)策略对网络结构进行搜索,设置融合先验知识的蔑视准则,提升网络的精确度。<br> 本文实现了这两个算法,并在心肌发育的单细胞转录组数据上进行了基因调控网络的构建。最后将本文网络学习结果与其他贝叶斯网络结构学习算法的实验结果进行对比实验,不论在时间开销还是网络的准确度上都明显优于其他算法,证实了本文设计的算法的有效性。
更多相关知识
- 浏览0
- 被引3
- 下载0
相似文献
- 中文期刊
- 外文期刊
- 学位论文
- 会议论文