您的账号已在其他设备登录,您当前账号已强迫下线,
如非您本人操作,建议您在会员中心进行密码修改

确定

应用SAS软件分析CagA蛋白序列可变区的多态性

Polymorphism analysis of variable region in CagA protein with SAS soft package

摘要:

目的:应用SAS软件进行数据挖掘,系统阐明幽门螺杆菌(H.pylori)CagA序列多态性及其特性.方法:采用SAS软件数据加工整理技术与生物信息学软件序列分析比对相结合的方法,对NCBI、swiss_prot/tremble、DDBJ三大蛋白数据库有关CagA蛋白序列数据进行整理,建立含97条完整序列及268条3'端部分序列的数据仓库,并对其进行多态性分析.结果:通过SAS程序对数据的整理加工后观察、统计分析,明确了可变区的位置及长度,准确地得出了EPIYA基序的重复频率、多态性及概率分布,EPIYA基序间隔序列的种类、特征及频度.CagA蛋白氨基酸序列长短不等主要是由于可变区的变化引起,可变区平均长度115.76±27.38aa.365例H.pylori菌株CagA可变区内EPIYA基序平均重复3.28±0.72次,最少1次,最多7次.EPIYA有9种突变型,占总数的7.18%.2个EPIYA基序之间的间隔序列,主要有7种,其中R3C、R4C中"FPLKRHDKVDELIKVG"及"TIDDLGGP"是西方株的特征基序,R3D中的"KIASAGKGVGGFSGAG",R4D中的"FPLRRSAAVNDLSKVG"及"TIDFDEAN"则是东亚株特征序列.EPIYA及其间隔序列不同组合构成CagA可变区17种不同的类型.在东亚株中EPIYA基序重复次数及EPIYA-D位点数明显少于西方株,EPIYA-A、EPIYA-B位点则多于西方株.结论:应用SAS软件可有效地对CagA蛋白可变区的多态性分析,从整体上把握了CagA可变区的序列特征,较以往的描述更详细、系统、合理.由于CagA序列可变区多态性的特点及与细胞毒性的关系,在此基础上进一步的研究可能揭示更多的分子生物学机制.

更多
  • 浏览:40
  • 下载:1

加载中!

相似文献

  • 中文期刊
  • 外文期刊
  • 学位论文
  • 会议论文

加载中!

加载中!

加载中!

加载中!