基于机器学习的心房颤动患者脑卒中风险预测模型构建与验证
Development and Validation of a Machine Learning-based Stroke Risk Prediction Model for Patients With Atrial Fibrillation
摘要目的:构建并验证基于机器学习的心房颤动(房颤)患者脑卒中风险预测模型.方法:本研究回顾性纳入来自美国重症监护医学信息数据库第Ⅳ版(MIMIC-Ⅳ)中的 19?895 例房颤患者,其中超过 95%为重症监护病房(ICU)患者,根据患者是否在本次住院期间发生缺血性脑卒中将其划分为脑卒中组(n=1 134)与非脑卒中组(n=18 768).收集资料包括人口学特征、合并症(如慢性心力衰竭、高血压)、实验室指标[血小板计数、国际标准化比值(INR)最大值]、动态生命体征(平均心率、平均动脉压)及抗凝治疗信息,并计算每例患者的CHA2DS2-VASc评分.采用合成少数类过采样技术(SMOTE)处理脑卒中事件发生率较低(5.7%)所带来的类别不平衡问题.使用随机森林和XGBoost算法构建预测模型,将数据集按 7:3 的比例随机划分为训练集(n=13 926)与测试集(n=5 969).模型性能通过受试者工作特征曲线的曲线下面积(AUC)、校准曲线和Brier分数进行评估,并与传统CHA2DS2-VASc评分进行比较;同时利用沙普利加性解释(SHAP)值分析各特征对预测结果的重要性.结果:脑卒中组年龄、女性比例、高血压比例、抗凝药物使用率及INR均高于非脑卒中组,血小板计数和平均动脉压均低于非脑卒中组(P均<0.001).随机森林模型(AUC=0.778,灵敏度 69.6%,特异度 72.5%)与原始XGBoost模型(AUC=0.751,灵敏度 67.3%,特异度 73.9%)预测脑卒中的效能优于CHA2DS2-VASc评分(AUC=0.538,灵敏度92.6%,特异度 10.2%).DeLong检验证实机器学习模型(随机森林模型和原始XGBoost模型)较CHA2DS2-VASc评分的AUC差异均有统计学意义(随机森林:ΔAUC=0.240 1,P<0.001;原始XGBoost:ΔAUC=0.213 2,P<0.001),而两个机器学习模型间的AUC差异无统计学意义(ΔAUC=0.026 9,P=0.203).McNemar检验进一步验证该差异.性别、平均动脉压及血小板计数为核心预测因子.校准后XGBoost模型高风险区间预测精度提升(Brier分数降至 0.052).结论:在预测住院房颤患者脑卒中风险方面,机器学习模型的表现优于CHA2DS2-VASc评分.本研究基于MIMIC-Ⅳ数据库,其中超过 95%为ICU患者,因此所构建模型更适用于急性病理状态患者,可为伴有急性并发症的住院患者提供个体化抗凝决策参考.
更多相关知识
- 浏览6
- 被引0
- 下载9

相似文献
- 中文期刊
- 外文期刊
- 学位论文
- 会议论文


换一批



