学位专题

目录>
<

基于孪生BERT网络和知识图谱的引文推荐研究

王丹雅
北京化工大学
引用
随着信息时代的发展,各类信息呈指数型增长,数字化学术出版物的数量也愈发庞大。面对海量文献,科研人员在撰写论文选择参考文献时往往面临着信息过载问题。引文推荐方法的出现与发展成为了解决这类现象的有效方法之一,但传统的引文推荐方法大多是仅考虑论文文本内容的基于内容的推荐方法,存在挖掘论文信息不够全面,属性利用单一的问题。知识图谱作为蕴含大量语义与结构信息的图网络结构,可以有效补充各类信息,近年来受到大量研究者关注。基于知识图谱嵌入的推荐方法较为常见,但其侧重于根据语义相关性进行建模,更适合于知识图谱内部的构建任务而非推荐系统。  针对以上问题,本文提出了基于孪生BERT网络的引文推荐模型和基于知识图谱和图卷积网络的引文推荐模型。论文主要工作如下:  (1)研究提出了一种基于孪生BERT网络的引文推荐模型。该模型综合考虑论文的标题、摘要、关键字、学科领域和来源等信息,构建了代表每篇论文的语句表示。利用BERT模型提取论文句子级特征,利用孪生网络避免单一BERT模型在计算语义相似度时造成语义特征缺失的问题,联合孪生网络和BERT模型分别提取施引论文和候选被引论文的文本特征。最后计算论文间的语义匹配度,并根据语义匹配度排序,生成引文推荐列表。  (2)研究提出了一种基于知识图谱和图卷积网络的引文推荐模型。利用图卷积神经网络将构建的论文知识图谱引入推荐系统。计算并聚合知识图谱中实体周围的邻居节点信息,充分挖掘知识图谱中的高阶结构信息和实体特征。将实体特征与由基于孪生BERT网络模型提取的论文文本特征融合,计算施引论文和候选被引论文间的引用概率。  (3)在学术论文数据集OAG和DBLP上进行了多组引文推荐实验。实验结果表明,本文提出的基于孪生BERT网络的引文推荐模型与基于知识图谱和图卷积网络的引文推荐模型的推荐效果均有提升。说明了融合知识图谱与论文文本信息的引文推荐模型比使用单一技术的推荐模型效果更佳。

知识图谱;引文推荐;图卷积神经网络;孪生网络;推荐系统

北京化工大学

硕士

计算机技术

万静;梁伟

2022

中文

TP391.3

2022-11-04(万方平台首次上网日期,不代表论文的发表时间)

相关文献
评论
相关作者
相关机构
打开万方数据APP,体验更流畅