• 医学文献
  • 知识库
  • 评价分析
  • 全部
  • 中外期刊
  • 学位
  • 会议
  • 专利
  • 成果
  • 标准
  • 法规
  • 临床诊疗知识库
  • 中医药知识库
  • 机构
  • 作者
热搜词:
换一批
论文 期刊
取消
高级检索

检索历史 清除

医学文献>>
  • 全部
  • 中外期刊
  • 学位
  • 会议
  • 专利
  • 成果
  • 标准
  • 法规
知识库 >>
  • 临床诊疗知识库
  • 中医药知识库
评价分析 >>
  • 机构
  • 作者
热搜词:
换一批

蛋白质结构预测及其模型质量评估方法研究

摘要蛋白质是生命活动的主要承担者,几乎支撑着生命的所有功能。蛋白质的功能取决于其独特的三维结构,获取蛋白质的三维结构是了解其生物功能的关键,具有重要的生物学和医学意义。通过X射线衍射、核磁共振和冷冻电镜等实验方法测定蛋白质的三维结构耗时、费力、成本高,无法满足高通量获取蛋白质三维结构的需求。因此,如何利用计算技术结合生物学知识,直接从蛋白质序列预测其三维结构是生物信息学的重要研究内容之一。<br>  能量函数的不精确性和蛋白质构象空间的高维特性,使得蛋白质构象采样成为蛋白质结构预测的主要挑战之一。特别是对于蛋白质结构中不规则的柔性Loop区域,其微小的变化可能对整体拓扑结构产生巨大的影响,因此Loop区的采样往往是不充分的;此外,离散的片段组装很难在连续的构象空间中采样到满足精细距离约束的最优解;因此,设计高效的构象采样算法是提高蛋白质结构预测精度的关键。模型质量评估是蛋白质结构预测的重要组成部分,对于挑选最佳模型和进一步的结构精修具有重要意义,设计高效可靠的模型质量评估方法是改善预测模型精度和提高预测模型可用性的重要手段。本文针对结构预测问题,提出了一种Loop区特定的扰动模型和构象采样算法;针对离散的片段组装提出了闭环连续二面角优化方法;针对模型质量评估问题,提出了基于深度学习的模型质量评估方法和基于模型质量评估反馈的从头蛋白质结构预测方法;针对蛋白质复合物结构,提出了复合物模型质量评估方法。<br>  本文的主要工作可以归纳为以下几点:<br>  (1)针对蛋白质构象采样过程中Loop区采样不足的问题,提出了基于种群的全局探索和Loop扰动的蛋白质构象采样方法。在全局探索阶段,通过片段组装广泛采样构象空间,并采用片段重组实现种群中构象的信息交互;在Loop扰动阶段,根据刚体旋转变换建立Loop区特定的扰动模型,并采用差分进化算法生成多组扰动角,从而在不引起拓扑结构大变化的情况下调整Loop区的结构。实验结果表明,Loop扰动能够有效提高结构的多样性和采样的成功率,并且Loop扰动产生的微小调整可以不断累积并最终产生可观的效益;使用Loop扰动后,Loop区域采样成功率提升至88.7%,预测模型的TM-score提升约19.0%。<br>  (2)针对离散的片段组装可能无法在连续的蛋白质构象空间中采样到最优构象的问题,提出了距离引导的闭环连续二面角优化方法。首先,为了增加构象的多样性,设计了局部二面角变异和交叉策略,以产生有潜力的新的二面角;其次,通过重新定义目标函数对Loop区扰动模型进行了拓展,使其能够快速调整Loop区两端二级结构的位置关系;最后,设计了基于距离比对的残基优化程度衡量指标,并对优化不足的残基进行有针对性的二面角优化。实验结果表明,所提方法能够显著改善距离辅助的片段组装方法的预测精度,二级结构调整和残基二面角优化分别使得预测模型的TM-score提升了约12.7%和15.0%。<br>  (3)蛋白质结构特征表达和深度学习网络训练是影响模型质量评估的两个主要因素。为了更全面的表征蛋白质结构模型,提出了残基级快速形状识别(UltrafastShape,Recognition,USR),刻画局部残基与整体拓扑结构的关系,与刻画残基局部结构信息的体素化特征形成互补;进一步采用来自多序列比对的序列特征来刻画蛋白质共进化信息,采用来自模板的结构特征来反映蛋白质家族信息。在网络模型设计方面,在残差神经网络的基础上,设计了三角形乘法更新和轴向注意力机制用来增强残基间的信息交互。在CASP和CAMEO数据集上的测试结果验证了所提方法的先进性和优越性。<br>  (4)为了研究蛋白质模型质量评估是否有助于提高结构预测的精度,在上述算法研究的基础上,提出了基于模型质量评估动态反馈的从头蛋白质结构预测方法。设计了两个残差神经网络,第一个网络用来预测残基间几何约束,并根据几何约束预测蛋白质结构;第二个网络用来评估预测模型的精度,并将评估结果反馈到几何约束预测网络,重新预测几何约束并纠正蛋白质结构模型。实验结果表明,模型质量评估反馈机制能够显著改善结构预测精度,所提方法优于主流的从头结构预测方法。<br>  (5)针对蛋白质复合物结构模型,提出了基于深度学习的复合物模型质量评估方法。从整体复合物特征、单体内特征和单体间特征三个层面刻画复合物结构模型。设计了单体USR,刻画局部残基与整体复合物拓扑结构的关系;设计了复合物USR,刻画单体内的局部残基与其他单体拓扑结构的关系;此外,基于蛋白质语言模型描述蛋白质序列信息和单体间序列的关系。通过训练基于三角形更新和轴向注意力机制的残差神经网络来预测蛋白质复合物每个残基的精度以及界面残基精度。实验结果表明,所提方法在界面残基精度评估上处于领先水平。<br>  提出的蛋白质单体模型质量评估方法DeepUMQA2在国际蛋白质结构预测领域权威赛事CAMEO的三个月(2022年3月11日至6月4日)盲测中获得冠军,提出的复合物模型质量评估方法DeepUMQA3在被誉为蛋白质结构预测领域的奥林匹克竞赛CASP15中的复合物界面残基精度评估中排名第一。

更多
广告
  • 浏览0
  • 下载0

加载中!

相似文献

  • 中文期刊
  • 外文期刊
  • 学位论文
  • 会议论文

加载中!

加载中!

加载中!

加载中!

特别提示:本网站仅提供医学学术资源服务,不销售任何药品和器械,有关药品和器械的销售信息,请查阅其他网站。

  • 客服热线:4000-115-888 转3 (周一至周五:8:00至17:00)

  • |
  • 客服邮箱:yiyao@wanfangdata.com.cn

  • 违法和不良信息举报电话:4000-115-888,举报邮箱:problem@wanfangdata.com.cn,举报专区

官方微信
万方医学小程序
new翻译 充值 订阅 收藏 移动端

官方微信

万方医学小程序

使用
帮助
Alternate Text
调查问卷