摘要目的:<br> 基于四种深度学习方法Cox-nnet、DeepOmix、Deepsurv和Nnet-survival整合临床和组学数据构建癌症患者预后预测模型并比较其预后性能,为探索临床与多组学数据构建有效的预后预测模型改善癌症患者预后提供建议,同时筛选出潜在肿瘤诊断标志物以及个体化治疗靶点,为癌症的靶向治疗提供重要依据。<br> 方法:<br> 从UCSCXena网站下载TCGA数据库六种癌症的临床和组学数据,组学数据提取泛癌基因后构建Cox-nnet、DeepOmix、Deepsurv和Nnet-survival预后预测模型,采用一致性指数和时间依赖性受试者工作特征曲线下面积评价模型的预测效果,识别出最优模型。以低级别胶质瘤患者的临床和mRNA数据为例进一步拟合最优模型,并在CGGA数据集中进行验证,绘制高低风险组的Kaplan-Meier生存曲线。对mRNA进行差异基因分析筛选出与低级别胶质瘤患者相关的生物标志物,并进行基因功能(GO)和信号通路(KEGG)功能富集分析。对临床性状的年龄、性别、癌症分级、最优模型mRNA结果的高低风险组以及差异表达基因进行单因素和多因素Cox分析,筛选出低级别胶质瘤患者的预后因素。<br> 结果:<br> 本研究基于四种深度学习方法构建癌症患者的预后预测模型,结果显示模型预测性能排序为DeepOmix>Cox-nnet>Deepsurv>Nnet-survival。DeepOmix模型在各癌症的C-index为0.79~0.93,AUC(3Year)为0.85~0.98,AUC(5Year)为0.89~0.99,预测性能均显著增强,表现出良好的鲁棒性。在以低级别胶质瘤患者的临床和mRNA数据为例拟合DeepOmix模型,利用外部数据库CGGA验证,TCGA-LGG的训练集、测试集、外部测试集CGGA1、CGGA2的C-index在0.81以上,AUC(3Year)在0.86以上,AUC(5Year)在0.91以上,进一步表明DeepOmix模型具有良好的预测性能,能显著区分高、低风险组患者,Kaplan-Meier生存曲线显示高低风险组之间存在明显生存差异,具有统计学意义(P<0.0001)。<br> TCGA-mRNA差异基因分析筛选出19个与低级别胶质瘤患者相关的生物标志物,GO富集分析结果主要与炎症反应、纤维化、免疫逃逸、细胞增殖与分化、细胞外基质重塑等有关。KEGG富集分析差异表达基因主要在PI3K-AKT信号通路、PD-1表达和PD-L1通路、松弛素信号通路等显著富集。对TCGA-LGG数据的临床性状和高低风险组进行单因素和多因素Cox分析结果显示年龄、癌症分级、高低风险组为低级别胶质瘤患者的预后因素。对差异表达基因进一步进行单因素和多因素Cox分析结果显示BMP5、CDKN2C、MSN和BRCA2基因差异具有统计学意义(P<0.05)。<br> 结论:<br> DeepOmix方法整合临床与高维组学数据构建癌症患者预后预测模型在六种癌症中均预测性能最佳,Cox-nnet方法次之,Deepsurv方法预测性能优于Nnet-survival。差异基因分析筛选出19个与低级别胶质瘤患者相关的生物标志物,GO和KEGG富集分析结果主要与炎症反应、纤维化、免疫逃逸、细胞增殖与分化、细胞外基质重塑、肿瘤生长、侵袭、转移和耐药性等有关。年龄、癌症分级、高低风险组、BMP5、CDKN2C、MSN和BRCA2基因为低级别胶质瘤患者的预后因素。基于DeepOmix整合临床和组学数据构建癌症患者预后预测模型可为临床工作者提供参考,辅助临床决策,为临床个性化治疗提供重要的理论依据。BMP5、CDKN2C、MSN和BRCA2基因可作为潜在肿瘤诊断标志物,为癌症的靶向治疗提供建议。
更多相关知识
- 浏览4
- 被引0
- 下载1

相似文献
- 中文期刊
- 外文期刊
- 学位论文
- 会议论文


换一批



