摘要长非编码RNAs(longnon-codingRNAs,lncRNAs)是一类长度超过200nt的重要非编码RNA。尽管lncRNAs缺乏直接编码蛋白质的能力,但其展现出的复杂多样的调控功能使其成为解读人类生理活动机制的窗口,这使得lncRNAs功能研究成为当今lncRNAs研究工作的一项重要内容。随着测序技术的飞速发展和生物信息技术不断进步,lncRNAs数量增长迅速。但受生物实验的时间成本和经济成本的限制,目前经实验检验出确切功能的lncRNAs数量仍十分有限。因此,迫切需要建立有效的计算模型来大规模快速预测lncRNAs潜在的调控功能。<br> 在生物信息学的研究中,通过计算两个基因之间的相似性,用已知推测未知的方法已被广泛认可,构建功能相似性网络是研究节点之间功能相关性的常用方法。因此,搭建lncRNAs功能相似性网络是推断lncRNAs潜在功能切实可行的方法之一。<br> 目前已有一些模型可以计算lncRNAs之间的相似性,但它们共有的一个缺陷就是均是仅考虑了lncRNAs多种调控机制中的一种,难以全方面的表示lncRNAs之间的功能相似性。针对这一问题,本文开发了一个全新的基于整合异构网络数据的lncRNA功能相似性网络模型,构建了能更加准确地描述lncRNA功能相似性的集成网络。该模型首先构建四个单一数据源的异构lncRNA相似性网络:基于miRNAs相互作用的lncRNA相似性网络、基于疾病关联的lncRNA相似性网络、基于GTEx表达谱的lncRNA相似性网络和基于NONCODE表达谱的lncRNA相似性网络。之后,以lncRNA对之间是否具有公共靶mRNAs为标准区分正负样本,计算出每个单一数据源网络ROC曲线的AUC值,作为其相似性权重。对于任一lncRNA对,计算它们在四个网络中加权相似度的平均值,将其作为集成网络中该lncRNA对的功能相似度。该集成网络全面考虑了lncRNAs调控下游靶基因的功能相似性、调节疾病的功能相似性和在器官或组织中差异表达的相似性。对比实验结果表明,集成网络具有更高的lncRNA功能相似性预测精度。<br> 为了方便研究人员使用本文的模型,我们构建了名为IHNLncSim的在线lncRNA功能相似性分析系统(http://www.lirmed.com/ihnlncsim)。该系统不仅具有计算lncRNA功能相似性数值的基础功能,还可以将计算结果可视化为网络图,便于用户分析结果。IHNLncSim还集成了一种基于疾病关联的lncRNA功能富集分析模块,为研究lncRNAs的功能提供了一个方便、高效的分析工具。
更多相关知识
- 浏览0
- 被引0
- 下载0
相似文献
- 中文期刊
- 外文期刊
- 学位论文
- 会议论文