10.3969/j.issn.1000-386x.2022.01.051
结合拓扑势与TextRank算法的关键词提取方法
传统的TextRank算法进行关键词提取时词语之间的连接边采用权值均分的形式进行加权,未考虑词语的语义信息.针对这种情况,提出结合拓扑势与TextRank算法的关键词提取方法.方法使用词频和词语在文中的分布情况对词语加权作为词语的全局影响;使用拓扑势的思想结合词语全局影响计算词语间的转移概率作为词语的局部影响;将转移概率矩阵应用于传统TextRank算法中.实验表明,考虑词语全局及局部重要性等语义信息可有效提升TextRank算法的准确率和召回率.
TextRank;算法;关键词提取;语义信息;拓扑势
39
TP3(计算技术、计算机技术)
四川省教育厅项目14ZB0315
2022-02-16(万方平台首次上网日期,不代表论文的发表时间)
共5页
334-338