首页 > 中国脑血管病杂志 > 预测伴右向左分流患者发生隐源性卒中的机器学习模型构建及可解释性分析

预测伴右向左分流患者发生隐源性卒中的机器学习模型构建及可解释性分析

Model construction and interpretability analysis of machine learning in risk prediction of cryptogenic stroke in patients with right-to-left shunts

二维码有效期 120s

摘要目的构建预测伴右向左分流(RLS)患者发生隐源性卒中的最优机器学习模型,并进行可解释性分析.方法回顾性连续纳入 2018 年 1 月至 2024 年 12 月于青岛大学附属医院崂山院区神经内科因偏头痛、不明原因头晕、卒中等行对比增强经颅多普勒超声(c-TCD)发泡试验并诊断存在RLS的患者.收集患者的一般资料及经胸超声心动图(TTE)检查的各项心脏参数,包括性别、年龄、吸烟史、饮酒史、高血压病、糖尿病、高脂血症、左心房直径(LAd)、左心房短径(LASd)、左心房长径(LALd)、左心室舒张末期内径(LVDd)、左心室收缩末期内径(LVDs)、左心室后壁厚度(LVPW)、室间隔厚度(IVS)、左心室射血分数(LVEF)及肺动脉收缩压(PASP).根据是否发生隐源性卒中将所有患者分为隐源性卒中组和未发生卒中组,比较两组患者的一般资料及TTE各项心脏参数.基于所有患者的一般资料及TTE检查的各项心脏参数构建预测RLS患者发生隐源性卒中的Logistic回归、决策树、随机森林、极限梯度提升(XGBoost)、梯度提升和极限树 6 种机器模型.采用重复10 次5 折交叉验证评估6 种机器学习模型的性能并分别绘制受试者工作特征(ROC)曲线,计算平均曲线下面积(AUC)、精确率、召回率、准确率和F1 得分.绘制 6 种机器学习模型的校准曲线评估各模型的预测概率是否接近真实概率,采用决策曲线分析(DCA)评估 6 种机器学习模型预测RLS患者发生隐源性卒中不同阈值概率区间内可提供的净获益,以确定预测模型的临床价值,阈值范围0～＜0.3 为低风险区域,0.3～0.6 为中等风险区域,>0.6～1.0 为高风险区域.以重复10 次5 折交叉验证中性能最优者(以AUC值为首要指标,AUC相同时优选敏感度最高者)为最优机器学习模型,采用 Delong 检验比较最优机器学习模型与其他模型间AUC差异.将所有患者按照8∶2 的比例随机分层抽样划分为训练集和测试集,基于训练集重新训练最优机器学习模型,并输入测试集中的数据进行Shapley加性解释(SHAP)分析.通过特征重要性柱状图(按平均SHAP值的降序排序)识别预测RLS患者发生隐源性卒中的核心预测因子;采用SHAP散点图分析特征值与模型输出的关联;采用SHAP Force图解析各特征预测单例RLS患者发生隐源性卒中的贡献度.绘制SHAP重要性排名前2 位特征的部分依赖图,评估2 个特征在RLS患者发生隐源性卒中预测中的边际效应及其非线性趋势,以探索最优机器学习模型量化关键预测因子与隐源性卒中发生风险的关系.结果共纳入310 例RLS患者,男181 例,女129 例,年龄18～70 岁,中位年龄52(43,52)岁,其中隐源性卒中组164 例,未发生卒中组146 例.(1)与未发生卒中组比较,隐源性卒中组患者年龄及男性、高血压病、糖尿病、高脂血症、吸烟史、饮酒史患者比例均更高,且 LAd、LASd、LALd、LVDd、LVDs、LVPW、IVS和PASP均更大(均P＜0.05);LVEF组间比较差异无统计学意义(P=0.306).(2)采用重复10 次5 折交叉验证评估预测RLS患者发生隐源性卒中的6 种机器学习模型的ROC,结果显示,极限树模型预测RLS患者发生隐源性卒中的平均AUC最高(0.804),其次为随机森林(0.792)、梯度提升(0.777)、XGBoost(0.776)、Logistic 回归(0.764)和决策树(0.717).(3)校准曲线显示,极限树模型的校准曲线(Brier分数为0.197)更加贴近参考线,其次为随机森林(Brier 分数为 0.210)、Logistic 回归(Brier 分数为 0.222)、梯度提升(Brier 分数为0.244)、决策树(Brier分数为0.263),XGBoost(Brier分数为0.280)最差.DCA 显示,在部分中等风险区域(0.3～0.6),极限树模型的DCA曲线展现出较高的净获益率,在部分点表现明显优于其他模型.在高等风险区域(>0.6～1.0)净获益率下降,在低风险区域(0～＜0.3)净获益率低且趋近不干预曲线,差异缩小.6 种机器学习模型中极限树表现最佳,AUC为 0.804,准确率为 0.719、F1得分为 0.736.Delong检验结果显示,极限树模型与决策树模型的AUC差异有统计学意义(P＜0.05),与其他机器学习模型的差异均无统计学意义(均P>0.05).(4)310 例RLS患者中,训练集248 例,测试集62 例.与测试集比较,训练集RLS患者PASP更高(P=0.037),余训练集与测试集一般资料及TTE各项心脏参数的组间差异均无统计学意义(均P>0.05).(5)基于训练集重新训练极限树模型,并输入测试集中的数据进行SHAP分析,结果显示,LAd对极限树模型的重要性最大,其次依次为LALd、年龄、LVPW、LVDs、高血压病、LVDd、吸烟史、PASP.SHAP散点图显示,可能增加了RLS患者发生隐源性卒中风险的特征排名前2 位为LAd和LALd.(6)极限树模型的Force图显示,当SHAP值为1.0 时,患者年龄为 68 岁,其LAd、LALd、LVDd、IVS、LVDs分别为 34、56、48、10、30 mm.其中,LALd 区域占比最大,LVEF区域占比最小.(7)基于极限树模型特征重要性前 2 位LAd与LALd生成RLS患者发生隐源性卒中的部分依赖图显示,LAd＜32 mm时其平均预测概率为0.40,LAd为32～42 mm时的平均预测概率从0.35 升至0.60,LAd>42mm时的平均预测概率增长趋缓(平均预测概率为0.65);LALd＜40 mm时平均预测概率稳定在 0.40 以下,LALd 40～55 mm时持续升至近 0.60,LALd>55 mm后增长变缓.结论基于RLS患者一般及TTE心脏参数构建的极限树模型可较为准确地预测RLS患者发生隐源性卒中的风险,其中 LAd和 LALd是影响极限树模型输出的排名前 2 位的重要因素,该模型在外部队列中的有效性及其对隐源性卒中发生风险的预测价值转化潜力仍有待进一步明确.