基于改进AT模型的微博用户兴趣挖掘研究
微博是信息时代兴起的一种社交网络工具,从微博的海量数据中可以挖掘出有价值的用户信息。传统的空间向量将文本转化再对其聚类的方法已经不能够有效的应对微博这种庞杂的文本数据,所以很多学者开始使用主题模型来对微博内容进行挖掘和分析,并且对微博内容的挖掘效果有了很大的提升,但是以往的研究中没有对微博的本身特性和微博用户的使用特性有足够的重视。本文针对微博的特性及用户的使用特性作了进一步的分析和研究,选择使用 AT模型来挖掘微博用户兴趣话题,然后以AT模型为基础将微博的转发特性融入模型中,提出微博生成模型AT_IR来挖掘微博的用户兴趣话题。通过爬取到的微博数据集进行验证实验,本文模型在对微博用户兴趣话题提取的准确性上以及模型的F1-measure的值要高于AT模型,说明加入微博用户行为特性可以在一定程度上提高用户兴趣话题挖掘的准确度。
微博用户;兴趣话题;转发特性;数据挖掘;AT模型
辽宁工程技术大学
硕士
软件工程
王永贵
2017
中文
TP393.092;TP391.1
58
2019-03-27(万方平台首次上网日期,不代表论文的发表时间)