摘要目的:获得菝葜Smilax china L.全长转录组数据,深入挖掘其功能基因.方法:采用PacBio Sequel测序平台,分别提取菝葜根、茎、叶 3 个部位的RNA,将样品等量混合后进行全长转录组测序及分析.结果:共获得转录本 122 324 个,N50 长度为 1400 nt,鸟嘌呤和胞嘧啶(GC)占比为 45.32%,其中 92 878 个(75.93%)转录本在七大数据库中注释.非冗余蛋白(NR)注释中,与菝葜最相近的物种是海枣Phoenix dactylifera L.,匹配程度达 17.39%;真核生物相邻类的聚簇(KOG)数据库注释中,比对到一般功能预测的转录本最多,有 17 875个;基因本体(GO)数据库注释中,66 001 个转录本分布于生物学过程、细胞组成和分子功能三大类的 45 个功能组;京都基因与基因组百科全书(KEGG)注释中,参与菝葜生物合成和其他次生代谢转录本 4286 个,其中参与黄酮类化合物生物合成的转录本 1478 个、参与皂苷生物合成的转录本 162 个、参与芪类化合物生物合成的转录本 4个、参与其他有机化合物合成的转录本 2642 个.在基因结构分析中,共得到 64 612 个编码序列、2003 个转录因子.此外,简单序列重复(SSR)分析表明,33 118 个SSR中最多的优势重复单元为腺嘌呤(A)G/C胸腺嘧啶(T),同时还预测到 44 580 个长链非编码RNA和 28 229 个mRNA.结论:获得了菝葜全长转录组数据,可为深入研究菝葜生长发育、相关代谢途径、胁迫响应及生物遗传多样性提供数据支持.
更多相关知识
- 浏览12
- 被引1
- 下载0

相似文献
- 中文期刊
- 外文期刊
- 学位论文
- 会议论文