学位专题

<
DOI:10.7666/d.Y3394601

基于用户联合相似度的协同过滤推荐算法研究

刘民康
重庆交通大学
引用
信息技术的迅猛发展和大数据时代的到来,造成了数据井喷式的增长,海量数据的累积超出了个体、群组对信息的处理及利用的合理范围,导致了信息过载现象的发生。推荐系统的出现有效的解决了这一问题,同时推荐系统也是数据挖掘、信息检索以及计算广告领域内的研究热点。协同过滤推荐算法是推荐系统领域中的经典算法之一,其主要思想是通过对目标用户寻找相近用户,并根据相近用户对某一物品的评价,预测目标用户对该物品的评价。随着推荐场景中数据规模的急剧增长,高维稀疏数据、时效性、冷启动等问题正对协同过滤推荐算法的推荐准确性产生严重的影响。  本文从定义和结构上对推荐系统进行了研究,对主流推荐技术做出了分析,同时对比了不同推荐技术的优劣。以此为基础,针对高维稀疏数据对用户相似度计算造成的准确性低的问题和时效性因素对评分预测产生的影响,提出了一种基于用户联合相似度的协同过滤推荐算法。本文的具体研究内容如下:  第一,研究协同过滤推荐算法,对协同过滤推荐算法的工作原理进行了详细的说明,分析算法在计算相似度和预测评分时存在的问题。  第二,针对高维稀疏数据造成的相似度计算结果准确性低的问题,提出了用户联合相似度的解决方案。用户联合相似度从结构上分为用户喜好分布的比较和用户个人属性信息的比较,最终通过线性组合的方式对两部分计算结果进行组合,得到用户之间相似度的计算结果。用户喜好分布的比较在整合数据后通过主题模型LDA计算得到喜好分布,利用巴氏系数度量不同分布的相似程度,过程中评分数据仅作为筛选依据,减缓了稀疏数据对计算结果的影响;用户个人属性信息的比较则在个人属性信息数值化之后通过信息论中的海明距离进行度量,得到不同用户个人属性信息间的相似值。  第三,针对时效性对预测评分产生的影响,通过具体物品的热度衰减来说明。在对所有物品进行热度统计的基础上,使用反比例函数对衰减程度进行量化,结合双曲正切函数映射后得到热度影响因子,热度影响因子反映物品热度的变化,作用于评分预测过程,时效性对预测结果具体影响予以体现。  最后,组合用户联合相似度和预测计算部分的改进构成基于用户联合相似度的协同过滤推荐算法。将本文提出的算法与传统协同过滤推荐算法在公开数据集ml-lOOk上进行实验,同时对实验结果进行分析比较,验证了本文提出算法的推荐准确性的提升。

推荐系统;协同过滤;稀疏数据;相似度计算;准确性;时效性

重庆交通大学

硕士

计算机科学与技术;计算机应用技术

朱振国

2018

中文

TP393.09

70

2018-08-31(万方平台首次上网日期,不代表论文的发表时间)

相关文献
评论
相关作者
相关机构
打开万方数据APP,体验更流畅