摘要随着生物测序技术的不断发展,产生了大量的DNA测序数据。第二代测序技术凭借其高通量、低成本的特点,在变异检测流程中被广泛使用。基因组测序数据在生命科学领域、医学健康领域等具有巨大的潜在价值,可以揭示人类遗传信息与疾病的关系。要发挥基因组测序数据潜在价值,就需要高效、准确的变异检测算法。变异检测是大规模基因组计划中重要的一部分,是生物信息学领域最关键的问题之一。随着基因组测序数据规模的持续增长,现有的变异检测算法已经无法满足时间效率、内存效率上的要求,阻碍了基因组数据分析的发展。<br> 本文总结了现有变异检测算法的主要思路和方法,针对现有的群体基因组联合变异检测算法在检测效率、准确性和敏感性上不足的问题,开发了一套面向第二代测序数据的大规模群体基因组联合变异检测算法。算法以群体样本的BAM为输入,旨在高效、准确地检测SNP。算法识别候选变异位点,在候选变异位点上下游区域构建群体样本的局部单体型,将部分单体型作为泛基因组。通过把单样本的测序片段与泛基因组重比对来保证变异检测的准确性和敏感性。为了提高算法的并行计算能力,把参考基因组分块,每块独立、并行地执行算法流程。通过在真实数据集上的评测,本文算法在接近现有工具的准确性、敏感性的前提下,显著提高了群体联合变异检测的计算速度。
更多相关知识
- 浏览0
- 被引0
- 下载0

相似文献
- 中文期刊
- 外文期刊
- 学位论文
- 会议论文


换一批



