摘要蛋白质通过相互作用,来发挥相应的活性和生物学功能,从而维持生命体中细胞的功能秩序。相互作用位点在三维空间中的结构信息构成了蛋白质间相互作用界面。由于相互作用后形成的复合物结构决定了它们的功能,所以只有确定并了解相互作用界面的结构信息,才能在结构水平上正确理解相关的分子机制和生物过程,并为疾病和药物的研究提供生物学见解。传统方法都采用实验手段来确定蛋白质相互作用界面。但实验方法技术难度较大、成本较高的问题使得已被解析出结构的序列数量远小于由基因组测序获得的序列数量。这推动了计算方法的出现以弥补实验方法的缺陷。最近,蛋白质内残基接触预测已经取得了突破性进展。然而,由于已知蛋白质结构和复合物同源序列的数量有限,预测异二聚体蛋白质间残基接触仍然是一个挑战。<br> 在这项研究中,本文提出了一个新的深度学习框架HDIContact,用于从序列信息推断蛋白质间残基接触。首先,基于基因距离或物种串联蛋白质单体的多序列比对,来为复合物构建相应的多序列比对,以丰富复合物的同源序列。然后,采用了预训练蛋白质语言模型MSAtransformer为模型生成多序列比对二维嵌入,这将有助于减少多序列比对中由于序列错配或同源性较低而导致的噪声所带来的影响。最后,对于生成的多序列比对二维嵌入,本文的工作基于多个双向长短期记忆网络从受体和配体两个不同方向学习残基对上下文信息,来直接预测异二聚体相互作用界面的残基接触图。在大肠杆菌测试数据集上的综合评估表明,HDIContact优于其他先进方法,精度达到了65.96%,AUROC为0.8308,AUPR为0.2502。此外,还在与人类免疫缺陷病毒相关的蛋白质复合物O75475-P04584上验证了本文提出的方法在预测人类-病毒蛋白质复合物方面的潜力。当定义预测概率排名前5的残基对为发生接触的残基对时,本文提出的方法的精度达到了80%。<br> 本文提出的方法是一个有价值的技术工具,可以为理解蛋白质-蛋白质相互作用机制提供帮助。这也将进一步促进对相关疾病的发病机理的理解,比如说艾滋病、肺炎等。同时也能为针对疾病的靶向药物的设计研发提供一些见解。
更多相关知识
- 浏览0
- 被引0
- 下载0
相似文献
- 中文期刊
- 外文期刊
- 学位论文
- 会议论文