运用机器学习构建肺癌与肺结核鉴别诊断模型
Constructing a differential diagnosis model for lung cancer and pulmonary tuberculosis using machine learning
摘要目的 运用机器学习方法构建预测模型,用于肺癌与肺结核的鉴别诊断.方法 回顾性分析2020年7月至2023年5月在广西壮族自治区胸科医院就诊的585例患者临床资料,年龄14~90岁,其中男457例,女128例.根据临床最终诊断结果,将585例病例分为肺癌组和肺结核组.比较两组病例肿瘤标志物检测结果的差异.运用Lasso和单因素logistic回归分析筛选肺癌与肺结核鉴别诊断的特征变量.构建随机森林模型,并对重要预测变量因素进行排序.构建Lasso-logistic回归模型;通过ROC曲线分析比较随机森林模型和Lasso-logistic回归模型的预测效能.结果 肺癌组血清肿瘤标志物CA125、CEA、CYFRA21-1、NSE、SCCA明显高于肺结核组,差异有统计学意义(P<0.05).Lasso/单因素logistic回归分析筛选出肺癌与肺结核鉴别诊断的特征变量为性别、年龄、CA125、CEA、CYFRA21-1、NSE、SCCA.通过随机森林模型对特征变量进行重要预测变量排序,依次为CYFRA21-1、CEA、SCCA、NSE、CA125、年龄、性别;Lasso-logistic回归分析结果显示,CYFRA21-1、CEA、NSE水平和年龄是区分肺癌与肺结核的独立危险因素(P<0.05);随机森林模型和Lasso-logistic回归模型鉴别诊断肺癌与肺结核的AUC、灵敏度、特异度、准确度、约登指数分别为 0.938、90.38%、87.50%、0.888、0.779 和 0.958、86.54%、92.19%、0.879、0.787.结论 肿瘤标志物CA125、CEA、CYFRA21-1、NSE、SCCA检测在肺癌和肺结核鉴别诊断中具有重要临床意义,本研究构建的随机森林模型和Lasso-logistic回归模型均能很好地区分肺癌和肺结核;Lasso-logistic回归模型确定,CYFRA21-1、CEA、NSE水平和年龄是鉴别肺癌与肺结核的独立危险因素.
更多相关知识
- 浏览12
- 被引0
- 下载13

相似文献
- 中文期刊
- 外文期刊
- 学位论文
- 会议论文


换一批



