基于机器学习算法预测早期结直肠腺癌病人内镜治疗后的癌症特异性生存状态
Prediction of cancer-specific survival status of patients with early colorectal adenocarcinoma after endoscopic therapy based on machine learning algorithms
摘要目的:基于机器学习算法构建早期结直肠腺癌病人经内镜治疗后的癌症特异性生存状态预测模型.方法:基于流行病学和最终结果数据库获取1 786例经内镜治疗后的早期结直肠腺癌病人资料,提取病人年龄、性别、种族、癌症原发部位、癌细胞分化程度、癌症组织病理学类型、放疗情况、化疗情况、肿瘤大小、病理情况、婚姻状况信息.经单因素Logistic回归与多因素Logistic回归分析确定早期结直肠腺癌病人内镜治疗后生存预后的独立影响因素.以8∶2的比例将病人分为训练集与测试集,将回归分析中有统计学意义的因素代入以机器学习算法构建的逻辑回归、随机森林、极限梯度提升、支持向量机、决策树、梯度提升决策树,基于最优机器学习模型对结果进行解释.结果:多因素Logistic回归结果显示,年龄、癌症原发部位、癌细胞分化程度、肿瘤大小、病理情况、婚姻状态是早期结直肠腺癌病人内镜治疗后生存预后的独立影响因素(P<0.05),随机森林在训练集与测试集中的受试者工作特征曲线下面积(AUC)分别为0.876和0.858,F1分数分别为0.791和0.739,基于随机森林的模型可解释性分析结果表明,年龄、婚姻状态、肿瘤大小重要性较高,年龄较高、肿瘤直径较大、分化程度较差及存在黏膜下浸润为死亡的危险因素,已婚为保护因素,癌症原发部位为右半结肠的病人相较于左半结肠病人生存状态较差.结论:机器学习构建的结直肠癌病人预后模型性能较好,可提供精准的个体化预测.
更多相关知识
- 浏览35
- 被引5
- 下载24

相似文献
- 中文期刊
- 外文期刊
- 学位论文
- 会议论文


换一批



