期刊专题

10.11897/SP.J.1016.2017.02352

基于随机游走的实体类型补全方法

引用
伴随着大数据的大量涌现以及开放链接数据(LOD)等项目的开展,语义网知识库的数量激增,语义网知识库正在引起学术界和工业界越来越多的关注,在信息检索系统中起着重要的作用,如实体搜索和问答系统等.实体类型信息在信息检索中扮演着重要的角色,例如,查询“汤姆·汉克斯所出演的电影”,该查询限定了返回的实体类型是“电影”,这对提高查询结果的精度具有重要作用.然而,知识库中实体类型信息的缺失是十分严重的,影响了知识库在信息检索等领域中使用的正确性和广泛性.据统计,在DBpedia2014中,8%的实体没有任何类型信息,28%的实体只有高度抽象的类型信息(比如类型为“Thing”),因此对于实体类型补全的研究尤其是实体细粒度类型的补全是十分重要的.目前已有的方法包括基于概率模型和表示学习两类.以基于概率模型的SDType算法为例.首先,SDType为每个谓词计算对各个类型的区分能力得分,然后,在为实体做类型补全时,累加该实体所具有的谓词对各个类型的得分.此类方法没有考虑谓词与谓词之间的相互增强作用,在存在知识缺失的情况下会影响补全效果.以表示学习的类型补全方法TransE为例,此方法对于简单的关系(1-1的关系)补全是可以的,但是对于补全实体类型这种复杂的关系效果并不理想.另外,表示学习的训练集尤其是负例难以获得.由于模型需要学习大量的参数,在大数据量的背景下,性能也是一个问题.文中提出一种基于谓词-类型推理图的随机游走方法来补全缺失的实体类型.首先对知识库中已有知识进行统计,包括具有某个谓词的实体数目、属于某个类型的实体数目以及属于某个类型并且具有某个谓词的实体数目.其次,基于得到的统计信息构建结点由谓词和类型组成的有向推理图,推理图的边包括谓词-谓词和谓词-类型两种.在构建推理图时,作者考虑了谓词之间的相互增强作用,在类型补全中是有效果的,尤其是在知识库存在知识缺失的背景下.最后,对于一个缺失类型信息的实体,根据该实体所具有的谓词在推理图上做随机游走来补全类型.为了解决由于知识库中存在错误知识等原因导致的类型语义漂移现象,文中使用PMI(点互信息)技术对结果进行了进一步的优化.在真实DBpedia知识库上的实验,验证了文中提出的算法相比于已有的典型算法有更高的精确度.

知识库、类型补全、图模型、随机游走、大数据

40

TP391(计算技术、计算机技术)

国家自然科学基金61472426,61402329资助.This research is supported by the National Natural Science Foundation of China under Grant No.61472426 and No.61402329.This project focuses on the basic primitives,query language,interactive interface,query optimization and processing and other key technologies of the exploratory search.Our team has been studying and working on this research field for years,and has published a series of papers in various international conferences and journals.This work is also supported by a gift of Tencent

2018-01-03(万方平台首次上网日期,不代表论文的发表时间)

共15页

2352-2366

相关文献
评论
暂无封面信息
查看本期封面目录

计算机学报

0254-4164

11-1826/TP

40

2017,40(10)

相关作者
相关机构

专业内容知识聚合服务平台

国家重点研发计划“现代服务业共性关键技术研发及应用示范”重点专项“4.8专业内容知识聚合服务技术研发与创新服务示范”

国家重点研发计划资助 课题编号:2019YFB1406304
National Key R&D Program of China Grant No. 2019YFB1406304

©天津万方数据有限公司 津ICP备20003920号-1

信息网络传播视听节目许可证 许可证号:0108284

网络出版服务许可证:(总)网出证(京)字096号

违法和不良信息举报电话:4000115888    举报邮箱:problem@wanfangdata.com.cn

举报专区:https://www.12377.cn/

客服邮箱:op@wanfangdata.com.cn

打开万方数据APP,体验更流畅