融合半监督学习与RoBERTa多层表征的中文医学命名实体识别
Chinese Medical Named Entity Recognition Based on Semi-Supervised Learning and RoBERTa Multi-layer Representation Fusion
摘要为减少现有的深度命名实体识别(NER)模型对高质量标注数据集的依赖,面向医学文本解析,提出一种基于半监督学习与RoBERTa多层表征融合的医学命名实体识别方法.该方法在RoBERTa-wwm-ext-BiLSTM-CRF多层表征融合模型基础上,设计伪标签方法扩充数据样本,构建噪声减弱模块以缓解伪标签数据中噪声的影响.在CCKS 2021医疗命名实体识别数据集和CBLUE CMeEE数据集上的实验结果表明,该方法与经典的BERT-BiLSTM-CRF方法相比,F1值分别提升了1.14%和1.63%,表明引入半监督学习策略并融合RoBERTa多层表征信息的命名实体识别方法可以有效提高医学实体识别效果.
更多相关知识
- 浏览2
- 被引2
- 下载2

相似文献
- 中文期刊
- 外文期刊
- 学位论文
- 会议论文