融合汉字部首的BERT-BiLSTM-CRF中医医案命名实体识别模型
Study on Named Entity Recognition of Chinese Medical Records Based on BERT-BiLSTM-CRF with Chinese Radicals
摘要目的/意义研究提取中医医案中医疗术语的方法,实现医案自动结构化,为医案知识发现提供结构化数据.方法/过程提出一种BERT结合长短期记忆人工神经网络、条件随机场和部首特征的深度学习命名实体识别模型,在BERT词向量中嵌入汉字部首,采用双向长短期记忆人工神经网络提取实体特征,使用条件随机场进行序列预测.将人工标注的400份共计5万余字的医案按照3:1划分为训练集和测试集,使用该模型识别中医医案中的身体部位、药物、症状、疾病4类命名实体.结果/结论该模型在测试集F1值为84.81%,优于其他未嵌入部首的模型,表明该模型能够更有效地识别中医医案中的命名实体,更好地结构化医案.
更多相关知识
- 浏览13
- 被引18
- 下载2

相似文献
- 中文期刊
- 外文期刊
- 学位论文
- 会议论文


换一批



