摘要组蛋白是真核生物核小体的组成部分,是细胞染色质的主要蛋白质成分。组蛋白修饰作为发生于组蛋白上的生物过程,是影响表观遗传的关键因素之一。修饰相关信息的检测识别为理解组蛋白修饰的基因调控机制提供了重要先决条件。本文开展了组蛋白修饰的计算建模研究,主要研究内容如下:<br> 基于多标签分类和多任务学习的深度神经网络模型,开发了iHMnBS来预测组蛋白修饰的类型。iHMnBS能够预测与DNA任何部位相结合的组蛋白修饰。在经典数据集上的评估结果表明,iHMnBS在7种组蛋白修饰类型的预测问题上具有卓越的性能优势,同时也为生物实验提供了准确的修饰组蛋白与DNA的结合位点。<br> 基于多模态特征融合的深度学习模型,开发了FusionSite来预测组蛋白巴豆酰化修饰的作用位点。FusionSite特别于一种修饰,深度探讨了使用多模态特征表示组蛋白赖氨酸的局部环境,包括图神经网络学习的蛋白质结构信息,和从蛋白质预训练语言模型提取的序列特征。在一系列修饰位点预测数据集上的评估结果表明,FusionSite不仅有效融合了蛋白质的多种表示形式,而且捕获了特异于巴豆酰化位点局部环境的表征信息。<br> 基于深度图神经网络模型,开发了UniMut来预测蛋白质错义突变的致病性,并在此基础上探索组蛋白修饰约束下错义突变与致病的关系。UniMut整合了突变前后的基因与蛋白的序列特征,并通过图网络进一步学习蛋白质的结构信息。在多个独立测试集和修饰组蛋白数据集上均取得了具有竞争力的表现。<br> 深度学习方法构建出高效的、健壮的、可解释的预测模型,为表观遗传学背后的作用机制提供了计算视角下的独到见解,并扩展了其在交叉学科领域的重要应用。
更多相关知识
- 浏览0
- 被引0
- 下载0
相似文献
- 中文期刊
- 外文期刊
- 学位论文
- 会议论文