10.3969/j.issn.1000-386x.2023.06.020
基于RoBERTa的工商业领域命名实体识别方法
工商业的迅速发展产生大量文本信息,刺激了该领域中文命名识别(NER)研究.但工商业领域数据集匮乏,且以往的方法不能很好地保留字在句子中的信息.为提高准确率,采用半监督方式的深度学习网络ICFNER模型,该方法是基于RoBERTa模型做预训练特征提取,增强了字的语义表示,创新性地结合BiLSTM-CRF组合模型获取序列化上下文特征,进行序列解码.该方法通过训练少量的标记数据集,实现NER任务.实验表明,该方法在有限的标注数据集上准确率、召回率和F1 值都有提升,在工商业领域NER任务中取得了良好的效果.
工商业领域、RoBERTa、命名实体识别、BiLSTM、条件随机场
40
TP3(计算技术、计算机技术)
国家自然科学基金61672337
2023-07-10(万方平台首次上网日期,不代表论文的发表时间)
共9页
124-132