摘要随着DNA计算研究的发展,DNA计算能解决的问题的规模越来越大,计算的精度与可靠性已经成为DNA计算能够具有现实意义的关键问题。在DNA计算中,信息总是通过特定长度的DNA序列来表示,信息的处理主要是通过DNA分子间的特异性杂交来实现的,而碱基对的分裂和形成在杂交过程中是一个基础的过程。因此,对核酸熔解过程中热力学性质的研究可以优化反应的条件,提高编码的质量,减少计算过程中假阳性的出现。<br> 本文在传统统计方法和邻近热力学方法预测熔解温度的基础上,抓住决定核酸熔解温度的生物因素中的氢键和碱基堆集作用,从序列碱基排列顺序与熔解温度的相关性入手,对DNA 双链与RNA/DNA杂交链的熔解温度预测作了一些研究和探索。<br> 本文针对传统统计方法忽视碱基堆集作用以及邻近热力学参数在各个研究小组之间并非一致。建立了一个基于邻近法二聚体的神经网络模型用于DNA 双链熔解温度的预测。发现神经网络方法更能发掘核酸熔解热力学过程中的统计规律,并可以避免热力学参数不一致带来的影响。同时,提出了根据ΔH°/ΔS°值对二聚体进行重新分类,将其作为神经网络的输入,在规模变小的情况下可以获得更高的精度,说明ΔH°/ΔS°值更能反映熔解温度与序列之间的相关特性。由于序列与二聚体频率并不是一一对应关系,这导致不同的序列可能有着相同的预测温度。本文提出将核酸序列转化成有向图,通过计算图中的有向欧拉路,可以求出具有相同二聚体频率的不同核酸序列有多少条,比较图的邻接矩阵可以判断序列的二聚体频率特征是否一致。并将该方法应用于蛋白质进行简单的序列分析。同时提出了一个基于图论方法的环和距离来描述任意两个编码间的相似度。为提高神经网络方法预测熔解温的分辨能力,将二聚体延伸至三聚体,并建立了一个新的神经网络预测熔解温度模型。为解决现阶段样本较少,网络在训练样本集上过度拟合的问题,依据焓变与熵变比值对三聚体频率进行了优化分组。并以此优化了三聚体的分组作为神经网络的输入来预测熔解温度,其精度明显优于与基于邻近二聚体模型的方法。为验证所提出算法的有效性,将其推广到预测RNA/DNA杂交链的熔解温度,建立了与相应的神经网络预测熔解温度模型,结果表明基于优化三聚体分组的BP神经网络方法是一种有效的预测熔解温度的方法。
更多相关知识
- 浏览0
- 被引0
- 下载0
相似文献
- 中文期刊
- 外文期刊
- 学位论文
- 会议论文