摘要心力衰竭,简称心衰,是各种心脏疾病发展的终末阶段。心衰患者预后死亡率是高度可变的,死亡率从5%到75%不等。因此评估心衰患者预后死亡率,根据预测死亡率情况来使医生制定更加科学的治疗方案,是防止病情进一步恶化,从而降低医疗开支的一种重要手段。目前,针对心衰预后死亡率研究模型主要分为两种,一种是根据医学知识和统计学出发的医学领域模型,另一种是依靠计算机算法的机器学习和深度学习模型。但这些模型都存在着患者特征利用不充分、忽略原始数据缺失对模型的影响和数据不平衡问题。因此,以解决上述问题为目的,从MIMIC-Ⅲ公开数据库提取数据,建立机器学习和深度学习模型来预测心衰患者预后五年内的全因死亡率。本文主要工作如下:<br> (1)从MIMIC-Ⅲ公开数据库提取10311例的可用于研究使用的心衰患者预后数据,将患者死亡类型分为四类:30天内死亡,180天内死亡,365天内死亡和365天后死亡。充分考虑患者信息将其总结归纳为7个不同的类别,分别是人口统计学资料,相关性疾病信息,用药信息,手术信息,ICU信息,实验室检测项目信息和一般检查信息。<br> (2)构建了基于混合加权距离的K近邻算法模型,用于预测心衰患者30天内的死亡率。首先,利用卡方检测和基于L1正则化的逻辑斯蒂回归对特征筛选和排序。接下来,为了克服K近邻算法难以利用单一距离准确度量带有离散和连续特征样本间距以及投票法不能衡量距离远近对待测样本类别的影响,提出了一种混合加权距离。即应用值差度量和曼哈顿距离混合计算样本间距,采用softmin函数对距离加权后输出最终待测样本类别。最终无重复随机抽样的2743例心衰数据实验证明了模型的有效性。<br> (3)构建基于多头自注意力机制的卷积神经网络模型。首先,对数据缺失值问题再处理即添加指示缺失值的指示向量。利用指示向量来指示特征值是真实值还是填充值,从而达到对缺失值进一步处理和扩充数据维度的作用。其次,在卷积神经网络的一层上使用具有不同尺寸大小的卷积核来获取不同感受野的特征。然后,将多头自注意机制应用在全连接层前,以获得整个信道的信息,这也是提升模型整体性能的重要一步。此外,引入了Focalloss损失函数以更好地解决数据的不平衡问题。最后,为了验证模型的有效性和深度学习所存在的“黑盒”问题,使用DeepSHAP理论进行深度学习模型分析,得到影响心衰患者预后死亡率的最重要的15个特征,并且结合临床医学知识对重要特征进行了分析。通过与其他模型对比性能和模型解释,进一步证实了模型的有效性和合理性,为医生制定更加合理的治疗方案提供了一定的参考。
更多相关知识
- 浏览0
- 被引6
- 下载0

相似文献
- 中文期刊
- 外文期刊
- 学位论文
- 会议论文


换一批



