摘要RNA是生物遗传信息的中间载体,在基因编码、解码、调控和表达等方面具有重要作用。RNA二级结构预测是理解RNA生化功能的主要途径。假结是最广泛的RNA结构单元,带假结RNA二级结构预测难度大,已被证明是一个NP完全问题。<br> 热力学模型是经典的RNA二级结构预测方法,搜索能量打分最低的RNA二级结构。结合RNA碱基配对概率,我们提出两种改进的结构预测方法,设计并实现了一种并行的带假结RNA二级结构预测方法。热力学模型能快速得到合理的RNA二级结构,但容易陷入局部最优并且受热力学参数的影响。<br> 深度学习具备强大的特征挖掘能力,可以突破热力学模型的限制。双向递归神经网络能学习到前后两个方面积累的特征信息,适用于RNA序列深度建模。本文研究并实现了基于递归神经网络的定长RNA二级结构预测模型和变长RNA碱基配对约束预测模型,将得到的配对约束与并行蚁群系统结合,实现了一种新的RNA二级结构预测方法。与常见的预测方法相比,深度学习模型在经典测试集上可以有效地提高带假结RNA二级结构预测的精度18%左右。<br> RNA二级结构预测包含多个流程,结构挑选是必要的后处理环节。本文基于谱聚类算法提出了一种结构挑选方法,实验表明挑选效果优于能量打分的方式。
更多相关知识
- 浏览0
- 被引1
- 下载0
相似文献
- 中文期刊
- 外文期刊
- 学位论文
- 会议论文