项目年度编号
2300190194
中图分类号
R73-3
成果公布年份
2023
成果简介
该项目属于基础研究与应用基础研究,是信息、数学、生物、医学等交叉学科领域研究课題。复杂性科学被称为是二十一世纪的科学,复杂系统已经滲透到人类生产与生活的方方面面。复杂网络是刻画与分析复杂系统及其不同对象之间复杂关系的有力理论工具与方法,日益增多的复杂网络数据,如电力网络、交通网络、计算机网络、社交网络、生物医学网络等,为人类分析与理解隐藏在复杂系统背后的原理与机制提供了巨大的契机。因此,复杂网络分析算法及其应用研究备受关注,由于网络存在结构复杂、功能未知、嗓声高、模式难以刻画等一系列问题。对复杂网络图模式分析提出了严峻的挑战与考验。
2010年以来,该项目针对复杂网络图模式刻画难、提取困难、应用难以拓展的问题进行深入研究。构建了复杂网络图棋式模型、设计了复杂网络图算法、拓展了复杂网络图模式挖掘在癌症基因组学的应用研究,获得了一批重要的基础性研究成果。主要创新性体现在:
一、复杂网络图模式挖掘模型构建,现有算法采用单一指标对网络图模式拓扑结构进行刻画,导致准确性低等问题,提出了基于非负矩阵分解的半监督图聚类模型,证明了半监督模型与模块密度之间的等价关系。同时,将理论等价关系拓展到多层网络。针对网络图聚类模型不能有效融合不完整背景信息的问题,提出了一种增强半监督图聚类模型。针对现有算法对时序网络链路预测中的特征独立性假设导致准确性低的问题,提出了基于特征压缩的时序网络链路预测模型。
二、复杂网络图聚类高效算法研究,现有图聚类算法难以对离群点与重叠点进行有效区分,通过范数引导非负矩阵分解,提出了正则化对称二逬制非负矩阵分解算法。针对单一目标聚类算法存在的独立性假设不合理、结果难以解释、准确性低等问题,提出了一种二分矩阵分解的双聚类算法,证明了非负矩阵分解在双聚类中的边界性质,提高了聚类结果的可解释性。针对三维张量分解困难的问题,提出了一种张量三角矩阵分解模型,提高特征的关联性与针对性。针对矩阵分解算法时间复杂性高,难以应用于大规模网络分析的问题,提出了基于字典学习的网络聚类算法,显著性提高矩阵分解算法的效率。
三、复杂网络图模式挖掘应用研究,针对基因表达谱数据分析过程单一目标聚类算法存在的独立性假设不合理、结果难以解释、准确性低等问题,提出了一种二分矩阵分解的双聚类算法,证明了非负矩阵分解在双聚类中的边界性质,提高了基因组学数据模式挖掘的可解释性与准确性;针对现有癌症基因组学集成学习算法忽略生物调控关系与异质性所导致的算法准确性低,提出了一种双层网络聚类分析算法,避免了组学数据异质性导致的特征冲突问题,转化了癌症基因组学集成分析楔式挖掘与经典多层网络图聚类问题。研究成果为生物与医学人员分析基因组学数据提供了有效的计算方法和分析手段。
该项目经过多年研究,发表高水平论文80余篇(SCI收录58篇),5篇代表作他引262次(Web of Science),篇均他引52.4次;研究成果引起广泛关系,受到了美国科学院院士、世界前1%高被引学者、IEEE Fellow等国际著名专家积极评价,已培养博士研究生5名,硕士研究生38名。
完成单位
西安电子科技大学 中央财经大学 中国科学院自动化研究所
完成人
马小科 王泉 张忠元 覃桂敏 董迪
- 浏览0
- 被引0
- 下载0
相似文献
- 中文期刊
- 外文期刊
- 学位论文
- 会议论文