摘要代谢子作为细胞调控过程的终端产物,其水平的改变通常被认为是生物系统对遗传或环境改变的最终反映。因此,识别疾病代谢子对于疾病的诊断、研究疾病发生发展的过程及病理机制意义重大。人体是一个复杂的生物系统,疾病的发生不仅仅表现在单独代谢组或基因组的变化,更有可能是代谢组信息、基因组信息及疾病之间交互作用所产生。然而,目前方法往往忽略了这种各组学信息之间的交互作用。在本研究中,我们提出了一个有效的整合多组学信息的CNPM方法,来优化和预测疾病候选代谢子。首先,我们整合了来自基因组、表型组、代谢组多个层面的信息构建了多组学复合网络。然后基于疾病候选代谢子与种子节点在该多组学复合网络中的距离相似性来对候选代谢子进行优化。我们通过对87个表型对应的602代谢子进行留一法交叉验证来评价CNPM方法整体预测效能,发现CNPM方法具有很高的预测效能,ROC曲线下面积能达到0.918。进一步,我们将87个表型分成18个疾病类,发现CNPM方法在18个疾病类中都有较好的预测效能,平均AUC值为0.896±0.01。CNPM方法还能够在缺乏已知疾病代谢子的情况下进行疾病代谢子预测。对CNPM方法鲁棒性分析表明该方法对于多组学复合网络中的噪音具有一定的鲁棒性。此外,我们还提供了一个全局的人类疾病-代谢子图谱,对疾病机制研究提供了全局理解。
更多相关知识
- 浏览0
- 被引0
- 下载0
相似文献
- 中文期刊
- 外文期刊
- 学位论文
- 会议论文