基于图模型决策的微博检索二次排序算法
为了解决微博检索面临的“用户查询”和“相关文档”都是极端短文本的情况,及由此造成的检索性能欠佳的难题,研究并实现了一种微博检索结果的二次重排算法,基于微博内容相似关系构建关系图模型,利用PageRank算法对微博检索结果进行二次排序。比较了基于余弦相似度、戴斯系数、单向戴斯系数等文本内容相似度计算方法。实验结果表明:二次排序算法能够有效提升微博检索性能,同时图模型迭代性能与相关主题比例存在依存关系。有鉴于此,讨论通过决策树重排算法去除非相关主题对微博排序的影响。
微博检索、二次重排、图模型、决策树
43
TP39(计算技术、计算机技术)
北京市优秀人才、北京市属高校青年拔尖人才资助项目CIT&TCD201404052;国家科技支撑计划资助项目2015BAK21B04;广西高校云计算与复杂系统重点实验室资助项目15205
2017-03-06(万方平台首次上网日期,不代表论文的发表时间)
共6页
94-99