项目年度编号
2200010020
中图分类号
Q51
成果公布年份
2021
成果简介
在全基因组范围内识别生物大分子的相互作用及功能有助于更深层次、更全面地了解大分子的功能机制及其相关疾病的发生机理。生物大数据时代的到来和以人工智能为代表的信息技术的发展,为基于计算的大分子相互作用和功能预测创造了条件。该项目融合多源异构信息,采用人工智能新方法和新技术,针对非编码RNA功能预测、蛋白质相互作用热点识别和蛋白质相互作用及功能预测等问题,研究开发了一系列新的、高效的计算预测方法,提升了现有方法的性能或效率。8篇代表作及论文共计被SCI他引291次,单篇最高他引90次,得到生物信息领域的国内外著名科学家、著名大学和研究机构的高度评价及权威专著的大篇幅引用。项目主要创新成果如下:
1)研发了基于多源异构网络融合的1ncRNA相互作用和功能预测方法。针对1ncRNA序列较长、保守性低和实验数据不足等问题,构建了基于多种异构数据源的全局网络,运用网络传播算法、Katz度量方法和基于多神经网络的层次多标签分类方法,建立了有效的1ncRNA相互作用和功能预测模型。通过融合更多的异构生物数据可以比已有的技术更准确的预测出1ncRNA相互作用及功能,覆盖度也更高。该工作得到美国医学与生物工程学院院士潘毅教授、瑞士伯尔尼大学Rory Johnson教授等人的高度评价与大篇幅引用,其中单篇最高SCI他引论文的IF为53.242。
2)提出了基于集成学习的蛋白质相互作用位点识别方法。在蛋白质-RNA相互作用热点识别方面,首次结合残基相互作用网络特征和溶剂暴露特征,将梯度提升树、支持向量机和随机森林模型的预测结果进行加权平均,取得了更加准确的预测结果。在蛋白质-蛋白质相互作用热点预测方面,研发了基于XGBoost算法和结构邻居属性的高效热点预测模型。在蛋白质-RNA相互作用位点方面,提出了基于梯度树提升算法和基于结构邻居属性的集成预测模型,预测结果具有更好的精度和鲁棒性。该工作被美国橡树岭国家实验室生物部门主任Julie C Mitchell以及多名国内外知名专家高度评价。
3)发展了基于多源信息融合的蛋白质相互作用及功能预测方法。首次融合了序列信息、大规模结构比对信息和特定位点打分矩阵等信息,提出了基于贝叶斯网络的蛋白质结构域功能预测方法,显著提升了结构域功能预测效果。研发了全新的预测1ncRNA-蛋白质相互作用的方法PLPIHS,通过随机游走算法计算出多源网络中所隐藏的特征信息,然后结合机器学习方法进行预测,AUC分数达到了0.97。该工作被匈牙利科学院Gdibor E.等人在Bioinformatics、美国加州大学河滨分校知名教授Tao Jiang在BMC Bioinformatics上进行了大段引用或作为基准测试方法。
完成人
邓磊 张祖平 唐勇军 张敬普
- 浏览0
- 被引0
- 下载0
相似文献
- 中文期刊
- 外文期刊
- 学位论文
- 会议论文