摘要随着新一代高通量测序技术的发展,原核生物基因组数据不断增长,而处理这些海量数据的难度也在增加。为了从如此庞大的生物学数据中快速而准确地挖掘出巨大的有价值的科学信息,大规模的、整体综合的自动分析流程就显得尤为重要。过去的几年里,已经有一些研究者利用生物信息学手段在基因组和转录组方面都分别开发了一些分析流程。但是,目前既含有基因组分析又含有转录组的分析流程还很少。在公共领域中,针对第二代测序数据,整合原核生物基因组和转录组分析,即利用转录组信息来完善基因组的分析流程还没有。因此,本文针对第二代测序数据,对整合原核生物基因组和转录组整体综合的分析进行研究。本文所取得的成果如下:开发了一个整合基因组和转录组方面的自动分析流程,在生物学分析方面分为3个部分:(ⅰ)基因组方面,包括基因结构和功能注释。这部分是在已有的研究工作基础上整合了一些常用的生物信息学软件来寻找蛋白质编码基因,RNA基因和基因组上其他的一些有功能的序列。这部分结果返回基因组彩色circle图和一些基本特征信息的文本文件。(ⅱ)转录组数据分析,包括基因表达谱,差异基因及功能分析,转录起始位点鉴定,UTR区域和intergenic区域分析。转录组方面主要是我们自己建立的一些分析方法。这部分会返回转录组单碱基覆盖度图和相应的分析结果。(ⅲ)整合基因组和转录组分析,包括验证完善基于预测的operon结构和基因组重注释。这部分的目的是完善基因组注释,并返回校正的基因组信息和operon结构。其次,利用幽门螺杆菌(Helicobacterpylori strain26695)基因组和转录组数据对建立的自动分析流程进行了测试。经过测试验证,本文建立的整合分析流程是基因组和转录组整体分析的一个有效方法。最后,本文还用我们实验室完成的嗜冷甲烷叶菌(Methanolobus psychrophilus R15)为实例对开发的自动分析流程的各方面进行了展示。
更多相关知识
- 浏览251
- 被引5
- 下载0
相似文献
- 中文期刊
- 外文期刊
- 学位论文
- 会议论文