摘要长链非编码RNAs(longnon-coding RNAs,lncRNAs)是一类长度超过200nt并且没有编码蛋白能力的RNA分子。鉴于lncRNAs具有复杂多样的调控功能,其已成为研究生物过程及人类复杂疾病的研究热点。由于lncRNAs具有低保守性、低表达水平和较高组织特异性等特点,目前只有极少数lncRNAs通过生物实验证明具有明确的调控功能,大多数lncRNAs的功能仍然完全未知。传统的生物实验方法虽然可靠,但需要大量的经济成本和时间成本,效率低下。随着高通量测序技术的不断发展,生物实验方法的弊端就更加突出。因此,迫切需要构建高效的计算模型来快速地预测lncRNAs的潜在调控功能,作为生物实验方法的补充。<br> 研究人员发现lncRNAs常通过调控靶基因的表达水平来发挥其功能。因此,通过计算方法预测lncRNA靶基因,依据靶基因功能预测lncRNA调控功能已成为一种重要的lncRNA功能研究方法。本文在分析现有RNA-RNA相互作用预测模型的基础上,针对其中存在的问题,提出了一种基于lncRNA二级结构的lncRNA靶基因预测模型(LncTar2.0),以期望为lncRNA靶基因预测探索出一种高效的新模型。LncTar2.0模型在已有模型(LncTar)的基础上,分割了lncRNA与靶基因的全局结合区域,并引入结合区域特征评分方法,定位结合最紧密的区域作为计算自由能的核心结合区域。综合考虑了lncRNA一级序列和二级结构特征,更新了计算自由能的互补能量模型。LncTar2.0模型还采用一种新的自适应能量阈值,即动态标准化自由能(dndG),以适应不同结合区域长度的可比性。最终,通过模型预测的标准化自由能(ndG)的绝对值与dndG之差来判断两个RNAs是否具有相互作用关系。<br> 本文在RISE数据集上进行了对比实验验证。相较于LncTar,LncTar2.0模型在预测性能上有了进一步提高。此外,在相同的数据集上,LncTar2.0模型的预测结果也优于其他主流的RNA-RNA相互作用预测模型。<br> 为了方便研究人员使用LncTar2.0预测模型,本文设计并实现了lncRNA靶基因预测系统。该系统不仅为用户提供了在线预测lncRNA靶基因的功能,还可视化展示了lncRNA-RNA结合区域的碱基配对情况,方便用户对预测结果进行深入分析。此外,该系统提供数据下载功能,用户可以根据所需下载相关数据。
更多相关知识
- 浏览0
- 被引0
- 下载0
相似文献
- 中文期刊
- 外文期刊
- 学位论文
- 会议论文