电子医疗文档的流式动态脱敏实现研究
Research on the realization of dynamic desensitization of electronic medical documents data through streaming processing
摘要目的:实现电子医疗文档在共享时的脱敏处理,保护患者隐私.方法:构建一个集成多种机器学习模型的医疗数据词法分析器,整理医疗健康领域的中文分词、词性标注和命名实体识别语料库,利用隐马尔可夫、条件随机场等自然语言处理技术和内置敏感信息特征库识别电子医疗文档中的敏感信息,并通过结果集流式处理技术实现动态脱敏.结果:算法模型在处理常规个人敏感信息时效果较好,个人敏感信息的发现与脱敏平均耗时在毫秒级别.结论:自然语言处理结合敏感信息特征库的方法可实现非结构化电子医疗文档敏感信息的识别与实时脱敏.
更多相关知识
- 浏览1
- 被引0
- 下载3

相似文献
- 中文期刊
- 外文期刊
- 学位论文
- 会议论文


换一批



