摘要随着生物信息学的不断发展,蛋白质复合物的研究对探索细胞与生命的奥秘有着重要意义。传统的基于生物实验的复合物检测方法存在着诸多缺点。近年来,随着高通量技术的发展,基于计算的蛋白质复合物预测方法逐渐成为主流。<br> 现有基于计算的蛋白质复合物预测方法通常采用传统的聚类算法对蛋白质相互作用(PPI)网络进行分析。但是由于网络结构的复杂性,这种直接分析的方式并不能充分利用网络中包含的信息。网络嵌入作为一种新型的数据预处理方法,可以有效地提取网络信息,从而提高分析的质量。因此,本文提出了一种基于深度网络嵌入的新型复合物预测方法(DANE)。该方法首先利用深度自编码器对网络信息进行提取,并在网络结构信息的基础上添加了生物功能信息作为补充,得到节点的向量表示。之后利用基于核心-附属结构的极大团挖掘算法对节点进行聚类,从而得到最终的蛋白质复合物预测。该方法使用的深度自编码器框架可以有效地提取网络中的非线性信息,同时过滤了数据中包含的噪声干扰。在DANE方法的基础上,本文重点关注了网络的全局结构信息,提出了基于邻居相似性网络嵌入的复合物预测方法(NANE)。该方法利用规范性指标计算出节点邻居结构的相似度,并以此为约束重新构建损失函数。通过对全局结构信息的有效提取,NANE方法的性能得到进一步提升。<br> 本文在6个PPI数据集上进行了对比实验来验证DANE和NANE这两种方法的有效性。实验结果表明,两种方法在多种评价指标上均表现出优于现有方法的效果,具有较高的可用性。
更多相关知识
- 浏览4
- 被引2
- 下载4

相似文献
- 中文期刊
- 外文期刊
- 学位论文
- 会议论文


换一批



