摘要下一代测序技术(NGS)的发展推动了基因组学在多个应用领域的研究。宏基因组学是研究大型微生物物种群体的一种强有效的方法,对于宏基因组样本中的未知物种,没有参考基因组的基因组装分析是一个非常具有挑战性的问题。同时,随着基因测序技术的飞速发展,基因组测序数据与日俱增。为了应对这些问题,可以使用分布式基因组装软件处理多个宏基因组样本。在本论文中,基于高度可扩展软件SWAP-Assembler2,对宏基因组组装分析的各个流程进行了一定的优化,提出了一种新的基于并查集数据结构的基因预测去冗余方法,均取得不错的效果。在此基础上,提出了一个名为WFswap的宏基因组分析流程,用于多样本大型基因组的组装分析。实验结果表明,所提出的工作流程WFswap表现出更好的性能,能够使得组装的基因更长,预测到的基准基因数更多。最后,本论文针对SWAP-Assembler2软件进行功能提升优化,进一步延伸contig,构建scaffold,成功提升了N50组装标准。
更多相关知识
- 浏览0
- 被引3
- 下载0

相似文献
- 中文期刊
- 外文期刊
- 学位论文
- 会议论文


换一批



