摘要为充分解析草酸青霉SG-4的遗传信息,利用二代Illumina测序和三代PacBio测序相结合的方法对SG-4的全基因组进行测序,经过基因组组装、基因预测和功能注释后,对全基因组进行共线性分析和次级代谢产物合成基因簇预测.结果表明,草酸青霉SG-4基因组全长为31.17 Mb,GC含量为50.5%,包括线粒体基因组在内,共由9条基因支架(scaffold)组成,含有8 430个蛋白质编码基因、175个tRNA和50个rRNA基因.与swiss-prot、Pfam、NR、GO和KEGG等数据库相比,COG数据库注释的基因数最多,可达7 483个.共线性分析结果表明,SG-4与数据库中报道的其他草酸青霉的同源性有一定差异,且存在多处异位重排现象.通过生物信息学分析发现,SG-4基因组中有28个次级代谢产物生物合成基因簇,其中,14个基因簇的功能未见报道,将NRPS相关基因簇与转录组数据进行对应的同时,分析与三峡肽素合成趋势的相关性,得到9条基因簇,经前期实验验证其中有一条可能是负责三峡肽素合成的候选基因簇.研究丰富了草酸青霉的基因组信息,为全面了解草酸青霉的基因组信息、揭示三峡肽素的生物合成途径奠定基础.
更多相关知识
- 浏览3
- 被引0
- 下载0

相似文献
- 中文期刊
- 外文期刊
- 学位论文
- 会议论文


换一批



