摘要随着大数据时代的来临,各行各业的数据量都在极速增长。医疗大数据作为最有价值的行业大数据之一,近年来人们对它的研究层出不穷。其中对于医疗质量评价的方法,研究者多数采用传统的基于经验或统计的方法进行分析,而随着医疗数据的逐步增长,传统医疗质量评价方法存在着样本过大、处理缓慢等问题。本文立足于某地的医保大数据,将传统医学的评价方法和数据挖掘进行融合应用,研究与实现了基于大数据的医疗质量评价模型,具体研究内容如下:<br> 1.离群指标的建立:经过噪声处理之后,数据是准确有效的,此时的离群点本身能够反映一定的医疗质量信息。本文通过对KNN算法进行了剪枝等改进,降低了算法的时间复杂度,使之更加适应大数据处理。然后基于统计的离群点检测算法和改进的KNN离群点检测算法,构建了离群指标,定义为两者检测结果中每个医院的离群点占比的比值。实验结果证明,它很好的检测出了医疗质量不佳的医院。<br> 2.病例优良率指标的建立:将数据挖掘中的聚类思想应用到病例质量研究领域使用广泛的包罗模型之中,由以往的经验二分法变成从数据本身出发的自动聚类多分法,构建了评价更加准确的病例优良率指标。采用X-means算法进行自动聚类,由于其在四维以上数据中效率低下,本文提出了一种新颖的基于属性重叠率(AOR)的分类方法,对得到的分类结果再进行聚类。实验结果显示聚类纯度和病例优良率指标准确度都得到了提升。<br> 3.医疗质量评价模型:基于离群指标和病例优良率指标,通过模型计算公式,得到每个医院最终的模型评价分数,进而对医院进行医疗质量评价分级,实验结果证明该模型能够较好的评价医院的医疗质量。<br> 4.大数据医疗质量评价系统的设计和开发:本系统基于Hadoop分布式平台,通过sqoop与Oracle数据库进行数据传输,采用HDFS和HIVE进行数据存储和管理,开发了集成离群指标和病例优良率指标的大数据医疗质量评价系统,并将相应的结果进行了可视化展示,结果显示本系统有着很高的实用价值。
更多相关知识
- 浏览0
- 被引8
- 下载0
相似文献
- 中文期刊
- 外文期刊
- 学位论文
- 会议论文