面向电子健康档案不完备混合数据的决策模型研究-论文-万方医学网

首页 > 河北大学 > 面向电子健康档案不完备混合数据的决策模型研究

面向电子健康档案不完备混合数据的决策模型研究

二维码有效期 120s

收藏纠错

摘要电子健康档案是人们在从事与医疗健康相关的活动时形成的，具有保存备查价值的电子化历史记录。经过十几年的发展，我国已在电子健康档案领域积累了大量的数据信息。利用机器学习方法从丰富的电子健康档案数据信息中自动发现潜藏的医学规律，对于疾病的预防、控制和治疗具有重要作用。然而电子健康档案的特殊性，即高度不完备性和取值模糊性，限制了传统机器学习方法的应用。因此，拓展针对电子健康档案特点的机器学习方法，并将其应用于电子健康档案的决策模型已经是十分必要的。<br>　　本论文首先提出了一种新的基于面积的模糊变量间距离的度量方法。该方法与最大-最小贴近度距离度量保持一致，但其计算更加简单。随后在这种度量方法的基础上，将k-NN填补算法的应用范围由清晰型数据拓展至模糊型数据，以至清晰模糊混合数据。具体来说就是，采用新提出的模糊变量间距离度量方法来寻找含有缺失值信息的模糊型样例、以及清晰模糊混合样例的“近邻”，之后再利用k个“近邻”的信息对其进行填补。然后将模糊变量简约的概念引入模糊型数据决策模型研究，建立了针对模糊型数据的极速学习机决策模型。该模型首先利用几个不同的模糊变量简约值，将模糊型数据集转化为多个清晰型数据集，再通过经典极速学习机对其进行学习，最后利用简约值计算的逆运算给出实际的模糊型决策。紧接着将这一思想继续拓展到清晰模糊混合数据情形，利用模糊变量简约值清晰化数据，并建立了一套面向输入为清晰模糊混合数据、输出为清晰型数据的极速学习机决策模型。最后将提出的填补和决策方法用于一个实际的妇幼保健管理系统电子健康档案中，给出了一套完整的面向不完备混合数据的极速学习机决策模型。<br>　　本论文创新点主要包括以下几个方面：(1) 提出了一种新的模糊变量间距离的度量方法，讨论了其特点；(2) 在模糊环境以及清晰模糊混合环境下对不完备数据填补理论进行了研究，提出了拓展的k-NN 填补算法；(3) 将模糊变量简约概念引入模糊型数据以及清晰模糊混合数据的决策研究，并建立了相应的模糊型数据决策模型和清晰模糊混合数据决策模型；(4) 分析了电子健康档案的不完备性和模糊性特点，并完整构建了针对这些特点的决策模型。