摘要在后基因组时代,蛋白质组学是一个非常重要的研究内容。蛋白质作为一种基础物质是直接参与了人类的生命活动,通常需要通过进行翻译后修饰(Post-translational modifications,PTMs)才能转化为具备功能的成熟蛋白,然而实验测定位点方法是有局限性的,运用机器学习算法建立快速识别模型已成为研究的热点。本文针对赖氨酸位点修饰问题,构建了糖化和SUMOylation两种相应预测方法,具体说明如下:<br> 1、基于特征选择的糖化位点预测方法。赖氨酸糖化涉及多种疾病,包括了衰老相关的疾病以及糖尿病的发生。通过开发预测工具PredGly,从而帮助实验人员预先筛选出待检测糖化位点,以此提升实验检测效率。PredGly提取了三种类型的特征表达方式,包括了序列信息、理化属性以及进化信息,此外,利用XGboost进行特征选择,去除融合特征中的无关和冗余信息。对于全新的独立测试集,PredGly的性能也优于其它糖化预测工具。<br> 2、基于卷积神经网络的SUMOylation位点预测方法。SUMOylation不仅在调节多种细胞过程中发挥重要作用,而且与许多严重的人类疾病密切相关。构建了赖氨酸SUMOylation预测工具DeepSUMO,利用卷积神经网络(Convolutional neural network,CNN)从原始蛋白序列中捕捉信息,并且结合增强的氨基酸组成信息,建立了一个基于两种序列信息表达的多输入深度学习模型。为了比较不同传统机器学习算法在SUMOylation位点预测上的表现能力,基于交叉验证考察了4种机器学习算法的综合能力。
更多相关知识
- 浏览21
- 被引1
- 下载4
相似文献
- 中文期刊
- 外文期刊
- 学位论文
- 会议论文