10.3969/j.issn.1001-8360.2022.12.008
融合注意力机制的铁路科技文献关键词抽取研究
大数据时代,海量铁路科技文献的关键词抽取、知识组织成为铁路行业科技信息资源赋能领域科研创新、科技攻关的基础性工作.鉴于传统关键词抽取算法缺乏精准语义信息、准确率低等问题,提出Bi-TextRank算法以改进铁路科技文献关键词的抽取效果.Bi-TextRank算法由两阶段组成,第一阶段用融合注意力机制的Word2Vec模型对铁路科技文献中的词汇进行向量表征,进而优化TextRank节点间的转移概率,迭代计算筛选出候选关键词;第二阶段在候选关键词的基础上,基于词间语义关系构建新的网络图,并通过TextRank算法进行关键词二次筛选.以CNKI铁路运输文献数据为例进行实验,结果表明改进算法相较于传统TextRank算法准确率、召回率、平均值F分别增加了4.9%、3.4%、4.3%,并优于其他对比算法.
铁路文献、关键词抽取、TextRank算法、Word2Vec模型、注意力机制
44
TP393;G250(计算技术、计算机技术)
河北省社会科学基金项目HB20TQ003
2023-02-10(万方平台首次上网日期,不代表论文的发表时间)
共8页
65-72