摘要蛋白质是基因表达的产物,是生命中的基本元素,具有维持生物体生命活动的重要作用,这使得蛋白质组学成为后基因组时代生命科学中重要的研究领域。准确预测蛋白质,对蛋白质进行精准分类,对研究其结构及功能具有重要的意义。随着后基因组时代的发展,蛋白质数据激增,通过传统的生物实验的方法确定蛋白质类别耗时费力。因此,开发一种利用理论方法与计算技术预测蛋白质的方法是非常有必要的。本论文主要基于深度学习算法,研究两类与疾病相关的蛋白质:网格蛋白与DNA结合蛋白,并分别创建了两种蛋白质的预测模型,对其进行在线识别分析。本文具体内容如下:<br> 1、基于混合深度学习模型的网格蛋白预测。网格蛋白是一种连接蛋白,由网格蛋白介导的内吞作用在生命活动中及其重要。此外,网格蛋白的缺失还影响着许多重大疾病的发生。因此,识别网格蛋白对维持生命体的健康具有重要意义。在此,我们使用网格蛋白的原始序列信息,利用氨基酸物理化学性质分组进行特征编码,引入卷积神经网络及长短时记忆神经网络,构建一个混合预测模型DeepCLA。交叉验证和独立测试的结果表明,利用混合深度模型可以有效提升预测性能,同时与现有的预测工具性能相比,DeepCLA预测性能更优越。这也为之后进行更深层次分析网格蛋白的结构与功能提供了线索。<br> 2、基于深度残差网络的DNA结合蛋白预测。DNA结合蛋白主要作用是与DNA结合并影响着人体内DNA转录、复制和选择性剪接等多种生物过程。我们收集了所有的DNA结合蛋白数据,基于K空间氨基酸对组成对蛋白质序列进行编码,以便模型可以提取有效的特征,并引入深度残差网络中的残差块构建了一个新的模型Deep-DBPNet。通过实验结果分析并与之前的预测工具比较,该模型进一步提高了DNA结合蛋白的分类效果。
更多相关知识
- 浏览0
- 被引0
- 下载0
相似文献
- 中文期刊
- 外文期刊
- 学位论文
- 会议论文