摘要microRNA(miRNA)是一类重要的内源性非编码RNA基因,它的长度很短通常只有大约21nt,能够对靶标mRNA的表达起着调控作用。参与了一系列重要的生长发育过程,包括植物的新陈代谢、抗病毒和动物细胞的增殖、凋亡等,并且和癌症等多种疾病的发生有着密切的关系。本文提出并实现了基于SVM的miRNA前体分类和成熟体预测方法,取得了良好的预测性能。<br> 首先,已知miRNA前体候选序列,提出并实现了基于SVM的植物miRNA前体分类模型和相应网站服务。本文从拟南芥和大豆的蛋白质编码序列中提取了假的茎环序列,这些假的茎环序列是在此项研究中首次提取得到。为了提高miRNA前体分类的性能,本文设计并实现了基于图的冗余特征去除方法和基于信息增益的特征选择方法。同时,基于miRNA前体在样本空间中分布,选择有代表性的miRNA前体作为训练样本。针对8个植物物种,本文建立的分类模型PlantMiRNAPred取得了超过90%的准确度。<br> 其次,已知判定为真的miRNA前体,提出并实现了基于SVM的植物miRNA成熟体预测模型和相应网站服务。根据miRNA的生源学,将miRNA:miRNA*作为一个整体,以提取植物miRNA更多的特征。本文提取了单核苷酸的位置相关特征、能量相关特征、结构相关特征和稳定性相关特征。选取信息增益较大的特征以提高 miRNA成熟体预测准确度。设计并实现了两阶段样本选择方法以解决真/假miRNA:miRNA*的不平衡问题。根据高维样本空间中的反例样本的分布密度,选取有代表性的反例训练样本。本文的方法能够准确的预测植物miRNA的位置。与已有预测算法相比,该方法取得了更高的预测性能。该预测模型能够给出假定miRNA的位置,有助于通过生物实验验证更多的miRNA前体和成熟体候选序列。
更多相关知识
- 浏览325
- 被引1
- 下载1

相似文献
- 中文期刊
- 外文期刊
- 学位论文
- 会议论文


换一批



