可解释机器学习模型预测恶性肿瘤合并急性呼吸衰竭患者预后: 基于美国eICU协作研究数据库 同步
Explainable Machine Learning Model for Predicting Prognosis in Patients with Malignant Tumors Complicated by Acute Respiratory Failure: Based on the eICU Collaborative Research Database in the United States
摘要目的基于可解释的机器学习模型构建可预测恶性肿瘤合并急性呼吸衰竭(acute respiratory failure ARF)患者重症监护病房(intensive care unit, ICU)死亡风险的模型, 并对其性能进行验证。方法检索美国急诊重症监护病房协作研究数据库, 提取恶性肿瘤合并ARF患者的临床数据(包括人口统计学特征, 合并症, 转入ICU后首个24 h内的生命体征、实验室检测指标、重要干预措施), 研究结局为ICU死亡。将入组患者按7:3的比例随机分为训练集和验证集。采用最小绝对收缩和选择算子回归筛选预测变量, 并运用极端梯度提升(extreme gradient boosting, XGBoost)、支持向量机、Logistic回归、多层感知器和C5.0决策树5种机器学习算法构建预测模型。基于受试者工作特征曲线下面积(area under the curve, AUC)、准确率、灵敏度等指标评估模型性能, 并采用Shapley加性解释(Shapley additive explanations, SHAP)算法对最优模型进行可解释性分析。结果共纳入3196例恶性肿瘤合并ARF的患者。其中训练集2261例、验证集935例; 转入ICU期间死亡683例, 存活2513例。LASSO回归最终筛选出12个与患者ICU预后密切相关的变量, 包括是否合并脓毒症, 是否使用血管活性药物, 转入ICU首个24 h内的平均动脉压最小值、心率最大值、呼吸频率最大值、血氧饱和度最小值、血碳酸氢盐最小值、血尿素氮最小值、白细胞计数最大值、红细胞平均体积最大值、血钾最大值及血糖最大值。经模型评价, XGBoost模型表现最佳。该模型在训练集和验证集中预测恶性肿瘤合并ARF患者ICU死亡风险的AUC分别为0.940和0.763, 准确率分别为88.3%和81.2%, 灵敏度分别为98.5%和95.9%, 且在敏感性分析中其预测性能亦最优。SHAP分析显示, 血氧饱和度最小值、血碳酸氢盐最小值、平均动脉压最小值、是否使用血管活性药物及白细胞计数最大值为对模型预测结果贡献居前5位的变量。结论本研究基于大规模数据集成功构建了恶性肿瘤合并ARF患者ICU内死亡风险预测模型, 并对其进行了可解释性分析, 有助于临床医生早期识别高风险患者并进行个体化干预。
更多相关知识
- 浏览0
- 被引0
- 下载0

相似文献
- 中文期刊
- 外文期刊
- 学位论文
- 会议论文


换一批



