• 医学文献
  • 知识库
  • 评价分析
  • 全部
  • 中外期刊
  • 学位
  • 会议
  • 专利
  • 成果
  • 标准
  • 法规
  • 临床诊疗知识库
  • 中医药知识库
  • 机构
  • 作者
热搜词:
换一批
论文 期刊
取消
高级检索

检索历史 清除

医学文献>>
  • 全部
  • 中外期刊
  • 学位
  • 会议
  • 专利
  • 成果
  • 标准
  • 法规
知识库 >>
  • 临床诊疗知识库
  • 中医药知识库
评价分析 >>
  • 机构
  • 作者
热搜词:
换一批

基于多核SVM的蛋白质结构类预测

摘要蛋白质的空间结构决定了其生物学功能,识别和预测蛋白质结构类有助于进一步了解更高层次的蛋白质结构特征,为蛋白质的功能研究及其相关药物设计提供了重要线索。常规的生物实验方法可以识别蛋白质结构类,但成本较高无法满足大规模蛋白质结构类分析的需求。利用蛋白质序列信息矢量表示和机器学习算法来预测蛋白质结构类,可以解决大规模蛋白质结构分析任务。<br>  为了提高蛋白质结构类预测的准确率,本文主要对蛋白质序列特征提取和多核学习等内容展开研究。使用多种特征提取方式对蛋白质氨基酸序列进行特征融合,然后采用多核支持向量机方法来识别和预测蛋白质结构类别。主要工作内容如下:<br>  (1)构建了一个多信息融合的蛋白质序列组合特征集。针对蛋白质序列特征表示,分析了多类特征提取方法,包括氨基酸组分、多肽组分、伪氨基酸组分和平均化学位移,以及低方差过滤、主成分分析等多类特征选择方法。首先采用PseAAC(Pseudo Amino Acid Composition)、DPC(Dipeptide Composition)、OTC(Optimal Tripeptide Composition)、和ACS(Average Chemical Shift)四种方法对氨基酸序列信息进行矢量表示并串联融合;然后采用低方差过滤与主成分分析方法对包含大量信息冗余的高维矢量特征进行降维;最后研究对比多种组合特征集在基准SVM(Support Vector Machine)模型上的表现,以及同一组合特征集在不同分类模型上的表现。交叉验证实验结果表明,输入向量为降维后的组合特征集PseAAC-DPC-OTC时模型准确率最高,使用基准SVM算法与网格搜索对降维后的数据进行分类预测更有优势,基于特征融合的蛋白质结构类预测方法在基准数据集上得到了有效的预测结果。<br>  (2)构建了一个组合特征集与加权多核SVM相结合的蛋白质结构类预测模型。首先采用降维后的伪氨基酸、三肽组成和二肽组成特征对蛋白质序列进行综合矢量表示;然后确定备选的基础核函数类别数量及其内部参数,选取多种不同参数下的核函数组合进行对比研究,采用五折交叉方法进行检验,比较不同核参数下分类模型的预测准确率;最后,通过综合对比模型查准率、查全率、F1与AUC值,确定最佳核参数与最适用于多核SVM模型的组合特征集。实验结果表明,PseAAC-DPC特征集结合多核SVM模型能够有效提高蛋白质结构类的预测准确性。提出的基于多核SVM与特征融合的分类模型相比其他SVM扩展模型在蛋白质结构类预测时具有明显优势,总体准确率达到了89.13%。

更多
广告
  • 浏览0
  • 下载0

加载中!

相似文献

  • 中文期刊
  • 外文期刊
  • 学位论文
  • 会议论文

加载中!

加载中!

加载中!

加载中!

特别提示:本网站仅提供医学学术资源服务,不销售任何药品和器械,有关药品和器械的销售信息,请查阅其他网站。

  • 客服热线:4000-115-888 转3 (周一至周五:8:00至17:00)

  • |
  • 客服邮箱:yiyao@wanfangdata.com.cn

  • 违法和不良信息举报电话:4000-115-888,举报邮箱:problem@wanfangdata.com.cn,举报专区

官方微信
万方医学小程序
new翻译 充值 订阅 收藏 移动端

官方微信

万方医学小程序

使用
帮助
Alternate Text
调查问卷