10.3969/j.issn.1000-386x.2019.11.031
面向工艺操作说明文本的命名实体深度学习识别方法
针对工艺操作说明文本中的命名实体,提出一种基于BiLSTM-CRF模型与词典、规则相结合的识别方法,旨在识别图纸编号、参考标准、零件和零件号等11种实体.基于BiLSTM-CRF模型,使用BERT模型预训练的向量,对相关命名实体进行初始识别;针对工艺操作说明文本中零件和零件号表达方式复杂多样的问题,使用基于词典和规则的方法对此类实体的标注结果进行校正.实验结果表明,该方法在工艺操作说明文本中能较好地完成命名实体识别任务,在测试语料上F1值达到94.03%,比基线提升了4.14%.
工艺操作说明文本、命名实体识别、双向长短时记忆网络、条件随机场
36
TP391(计算技术、计算机技术)
辽宁省自然科学基金项目20170540705
2019-11-29(万方平台首次上网日期,不代表论文的发表时间)
共9页
188-195,261