基于并行异构图和序列注意力机制的中文实体关系抽取模型
Chinese entity and relation extraction model based on parallel heterogeneous graph and sequential attention mechanism
摘要近年来,随着深度学习技术的快速发展,实体关系抽取在许多领域取得了显著的进展.然而,由于汉语具有复杂的句法结构和语义关系,面向中文的实体关系抽取任务中仍然存在着多项挑战.其中,中文文本中的重叠三元组问题是领域中的重要难题之一.针对中文文本中的重叠三元组问题,提出了一种混合神经网络实体关系联合抽取(HNNERJE)模型.HNNERJE模型以并行方式融合序列注意力机制和异构图注意力机制,并结合门控融合策略构建了深度集成框架.该模型不仅可以同时捕获中文文本的语序信息和实体关联信息,还能够自适应地调整主客体标记器的输出,从而有效解决重叠三元组问题.另外,通过引入对抗训练算法提高模型对未见样本和噪声的适应能力.运用SHAP(SHapley Additive exPlanations)方法对HNNERJE模型进行解释分析,基于模型的识别结果解析它在抽取实体和关系时所依据的关键特征.HNNERJE模型在NYT、WebNLG、CMeIE和DuIE数据集上的F1值分别达到了92.17%、93.42%、47.40%和67.98%.实验结果表明:HNNERJE模型可以将非结构化的文本数据转化为结构化的知识表示,有效提取其中蕴含的有价值信息.
更多相关知识
- 浏览0
- 被引5
- 下载0

相似文献
- 中文期刊
- 外文期刊
- 学位论文
- 会议论文


换一批



