摘要得到基因数据后,要分析全部基因的功能,阐明基因组所表达的真正执行生命活动的全部蛋白质的表达规律和生物功能,最直接的是进行蛋白质结构研究。在膜蛋白结构与功能研究的具体领域中,膜蛋白类型预测是一个重要的基础性研究,利用分子生物学方法来预测膜蛋白已经不能满足日益增长的膜蛋白序列的需求,因此,本论文结合智能计算的相关技术,挖掘膜蛋白序列内氨基酸的排列顺序信息,以更好的理解膜蛋白序列与结构、功能之间的关系。另外,越来越多的基因组大规模测序提供了更多的膜蛋白序列,同时也为膜蛋白的相互作用提供了基础。膜蛋白的相互作用在生命活动中起重要作用,不仅控制正常的生理过程,也在病理过程中起着重要的作用;不仅为注释未知膜蛋白的生物学功能提供了线索,也为研究膜蛋白结构,了解生命活动的机制,提供了必要的信息。<br> 本论文在膜蛋白序列的基础上研究膜蛋白的结构,主要从两个方面进行:膜蛋白结构类预测研究和膜蛋白相互作用识别预测。采用伪氨基酸组成理论和近似熵算法,优化参数组合,根据参数不同组合形成不同的分类器,最终构建一个集成分类器,用来对膜蛋白的结构类进行预测;建立模糊支持向量机网络,结合生物物理属性对膜蛋白进行分类。在膜蛋白相互作用研究中,收集较多的正样本数据,借助实验数据提取相互作用特征,应用模糊支持向量机算法识别膜蛋白相互作用;在此基础上,采用不同的特征表示,建立另外的数据集,应用AdaBoost算法集成多个弱分类器,用来预测膜蛋白相互作用,以更好的研究膜蛋白的结构和功能。本论文具体的研究内容有:<br> 在膜蛋白二级结构类预测中,采用伪氨基酸成分理论描述膜蛋白序列,近似熵方法计算结果作为补充序列信息,使用优化后的权重系数,根据参数设置的不同,组合建立多个不同的分类器,集成了多个模糊k近邻分类器,经过训练、测试,应用集成分类器预测膜蛋白结构分类,刀切法测试证明了该方法的有效性和实用性。<br> 针对传统支持向量机分类问题中出现不可分区域的问题,引入模糊隶属度函数,构成模糊支持向量机分类器,集成多个这样的分类器构建模糊支持向量机网络,结合膜蛋白序列的物理化学属性信息预测膜蛋白结构类。<br> 由于膜蛋白的疏水等特性,其结构数据在整个蛋白质数据库中所占比例非常小,实验方法获取膜蛋白相互作用更是困难,所以已知的膜蛋白相互作用数据非常少。本文提出用模糊支持向量机算法识别未知的膜蛋白对,收集较多的正样本数据,借助实验数据提取相互作用特征,经验证,该算法是有效的。<br> AdaBoost的原理是,一个弱学习器不能很好学习的样本,将尽可能成为下一个弱学习器着重学习的样本,因此,我们应用AdaBoost算法集成多个弱分类器,结合不同的数据集,采取不同方法提取膜蛋白相互作用特征,以获得更好的特征表示,应用集成分类系统对膜蛋白相互作用进行分类预测,取得了很好的结果。<br> 最后,总结了全论文的工作,指出了研究工作中存在的不足,并对今后的研究方向和研究重点进行了讨论。<br>
更多相关知识
- 浏览0
- 被引1
- 下载0
相似文献
- 中文期刊
- 外文期刊
- 学位论文
- 会议论文