10.16451/j.cnki.issn1003-6059.202106001
基于异质网络表示学习的姓名消歧
在系统中搜索某一姓名时,会返回该同名作者的所有文档(如论文、网页),严重影响用户体验,姓名消歧可提高检索精度.因此,文中提出基于异质网络表示学习的姓名消歧方法.首先为每个歧义姓名构造一个论文异质网络.然后使用异质网络表示学习并结合词向量化语义表征学习方法,获取网络中每个论文节点的表征向量.最后使用具有噪声的基于密度的聚类方法与规则匹配结合的聚类方法将论文划分给不同的作者实体.文中方法在OAG-WholsWho比赛数据集上的性能较优,结果验证方法的有效性.
姓名消歧、异质网络、词向量化(Word2Vec)、分类算法
34
TP391.41(计算技术、计算机技术)
国家自然科学基金;中国科学院信息化专项
2021-07-19(万方平台首次上网日期,不代表论文的发表时间)
共12页
485-496