基于SMOTE-ENN结合XGBoost算法构建胰腺癌术后生存预测模型
Construction of a prediction model for postoperative survival of pancreatic cancer based on SMOTE-ENN combined with XGBoost algorithm
摘要目的 采用不同机器学习算法在美国癌症联合委员会(American Joint Committee on Cancer,AJCC)新版分期的基础上应用大规模数据构建胰腺癌术后患者的生存结局预测模型.方法 基于监测、流行病学和最终结局(Surveillance,Epidemiology,and End Results,SEER)数据库使用合成少数类过采样技术(synthetic minority over-sampling technique,SMOTE)与合成少数类过采样技术和编辑最近邻(synthetic minority over-sampling technique and edited nearest neighbors,SMOTE-ENN)算法处理不平衡数据,利用随机森林、支持向量机、决策树、极端梯度提升(extreme gradient boosting,XGBoost)算法构建预后模型并进行对比,引入Shapley可加性特征解释(Shapley additive explanation,SHAP)对模型进行解释.结果 SMOTE-ENN结合XGBoost模型的性能最好(准确率为86.2%,精确率为95.2%,召回率为71.2%,F1值为0.762,曲线下面积为0.884,Brier分数为0.108),校准曲线和决策曲线分别说明该模型具有良好的校准效果和较高的临床应用价值;此外,SHAP分析显示,对预后结局影响最重要的为N分期.结论 XGBoost模型性能最优,可作为新版AJCC分期下高性能术后预后预测模型,为预测术后患者的生存结局及制定个性化治疗方案提供理论支持.
更多相关知识
- 浏览2
- 被引0
- 下载0

相似文献
- 中文期刊
- 外文期刊
- 学位论文
- 会议论文


换一批



