摘要人类基因组计划完成后,生物信息的挖掘研究成为新的热点.研究重心从揭示生命的所有遗传信息转移到从分子整体水平对功能的研究上.内容包括基因功能发现、基因表达分析及突变检测,分子进化等.该项研究建立了一个可拓展的、高效的、从基因组和染色体的宏观角度,以及单个基因的微观角度,研究分子进化和基因功能的生物信息学平台.并且在这个平台的基础上对基因组多态性信息进行了分析.采用Perl语言为工具进行建库和CGI编程以及统计分析程序的设计,操作平台为Redhat Linux.设计了系列程序对数据进一步分析,生成子数据库或者获得新的描述信息.以所有染色体上的假基因和1、X、Y染色体上的CDS区为研究对象,对GC含量、假基因长度、SNP密度、SNP类型、内含子剪切位点、内含子长度、内含子和重复序列位置分布,以及它们的相互关系等做了分析,并进行了一些深入的探讨.对人类基因组24条染色体假基因的GC含量做分析,可得:GC含量的平均值为0.46.27%,一半假基因的GC含量都在45.61%以内,假基因的GC含量最高的是16号染色体,为54.3%,最低的是人类的Y染色体,为40.35.假基因长度集中分布在2000bp以内,而Y染色体上的假基因平均长度9321.4bp,是所有染色体中次高的一个.染色体上内含子GC含量有明显的峰值出现在40%的GC含量处,GC含量的平均值为45.54%,内含子同假基因一样出现GC含量的偏低现象.而且其峰值十分接近.在基因组、染色体的层面观察到假基因和内含子的长度和GC含量存在着负相关性,内含子剪切模式在各个染色体上变化不大.SNP的分布主要集中在内含子区,而Y染色体上面的SNP相比较而言更加倾向于在外显子区分布.
更多相关知识
- 浏览0
- 被引1
- 下载0

相似文献
- 中文期刊
- 外文期刊
- 学位论文
- 会议论文


换一批



