DOI：10.3969/j.issn.2095-2163.2021.03.020

融合知识的中文医疗实体识别模型

引用

摘要：

从医疗文本中抽取知识对构建医疗辅助诊断系统等应用具有重要意义.实体识别是其中的核心步骤.现有的实体识别模型大都是基于标注数据的深度学习模型,非常依赖高质量大规模的标注数据.为了充分利用已有的医疗领域词典和预训练语言模型,本文提出了融合知识的中文医疗实体识别模型.一方面基于领域词典提取领域知识,另一方面,引入预训练语言模型BERT作为通用知识,然后将领域知识和通用知识融入到模型中.此外,本文引入了卷积神经网络来提高模型的上下文建模能力.本文在多个数据集上进行实验,实验结果表明,将知识融合到模型中能够有效提高中文医疗实体识别的效果.

关键词：实体识别、序列标注模型、融合知识

所属期刊栏目：11

分类号：TP391.4(计算技术、计算机技术)

在线出版日期：2021-06-21（万方平台首次上网日期，不代表论文的发表时间）

页数：共4页

页码：94-97

英文信息展示

个人中心

我的学术圈

我的书案

退出

期刊专题

融合知识的中文医疗实体识别模型