基于高通量测序的极小种群野生植物长梗杜鹃转录组分析
Transcriptome Analysis for Rhododendron longipedicellatum (Plant Species with Extremely Small Populations)Based on High Throughput Sequencing
摘要为加强特有濒危植物长梗杜鹃资源的评价、保护和鉴定工作,及为今后遗传育种和改善其农艺性状提供有益参考.本研究采用新一代高通量测序平台Illumina HiSeq 4000对其转录组测序,得到的数据过滤后进行de novo组装并聚类去冗余,获得74 092个Unigenes,平均长度、N50、Q20、Q30以及GC含量分别为938 nt、1 616 nt、98.22%、95.20%和43.24%,其中1Kb以上的Unigenes有23 879条.通过与七大功能数据库比对,分别有39 876 (NR:53.82%)、38 065(NT:51.38%)、27 384(Swissprot:36.96%)、16 099(COG:21.73%)、30 401(KEGG:41.03%)、17 518(G0:23.64%)以及29 676(Interpro:40.05%)条Unigenes获得功能注释.长梗杜鹃转录组中的Unigenes根据GO功能大致可分为生物学过程、细胞组分和分子功能3大类56亚类,其中执行生物学过程的基因最多,占41.53%;与COG数据库比对,根据其功能大致可分为25类;以KEGG数据库为参考,可归为6个代谢通路大类、32类代谢途径,并发掘出176条与人类疾病相关的Unigenes,包括内分泌及代谢疾病(167条)和抗药性(9条).根据注释结果共检测出39 418个CDS,未注释上的Unigenes使用ESTScan预测后获得3 194个CDS.同时,预出到1 488个编码TF的Unigenes,以及检测到57 927个SNP多态位点.该转录组分析为今后长梗杜鹃乃至杜鹃属植物功能基因挖掘与利用、基因克隆、抗性机理分析、遗传资源分类和进化、分子标记开发以及分子辅助育种等研究提供了基础数据和重要参考.
更多相关知识
- 浏览165
- 被引10
- 下载0

相似文献
- 中文期刊
- 外文期刊
- 学位论文
- 会议论文