摘要随着系统生物学和蛋白质组学研究的不断深入,基于蛋白质相互作用网络识别蛋白质复合物逐渐成为计算生物学的一个基本问题。高通量实验产生大量包含噪音的蛋白质相互作用数据,这些噪音势必会影响到算法识别复合物的结果。因此,应用聚类算法识别复合物之前需要去除噪音的影响。本课题对蛋白质相互作用网络中识别复合物的聚类算法进行研究,主要工作包括以下两点:<br> (1)为了减少高通量实验检测的蛋白质相互作用数据中噪音的影响,选择从拓扑结构上分析相互作用网络的特性,提出了一种新颖的减少相互作用数据噪音的方法PPIR(Protein-ProteinInteractionReliability)。PPIR方法首先将两蛋白质对和它们的共同邻居结点以及它们相连的边当作一个模块。这两蛋白质相互作用的可信度主要由它们之间的共同邻居结点决定,数值上等于共同邻居结点所占整个模块的比例。再把可信度值作为相互作用网络的权值,进而构建出加权相互作用网络。实验表明,使用PPIR方法构建的加权网络总比原始网络实验效果好。将PPIR方法和已有的同类方法相比较,PPIR方法识别复合物表现出非常好的实验效果,以及能够提升聚类算法识别复合物的性能。<br> (2)基于PPIR方法,提出了一种从蛋白质相互作用网络里识别复合物的图聚类算法PPIPU。首先应用PPIR方法作用于初始蛋白质相互作用网络,从而减少了噪音对聚类结果的影响。其次,集成RRW,MCL和ClusterONE三种聚类算法,并对结果进行后续处理,最终得到了对蛋白质相互作用网络的聚类结果。为了评估PPIRU算法的有效性,论文中比较了PPIRU算法和几种经典算法。使用DIP和BioGRID蛋白质数据集,并将最终结果分别与MIPS和SGD标准复合物集进行匹配。实验表明,PPIRU算法和其它聚类算法相比,其聚类的有效性以及与标准复合物匹配的可靠性都具有较大的优势。
更多相关知识
- 浏览257
- 被引6
- 下载0

相似文献
- 中文期刊
- 外文期刊
- 学位论文
- 会议论文


换一批



