10.13266/j.issn.0252-3116.2014.22.012
基于层次概率主题模型的科技文献主题发现及演化
自动挖掘科技文献主题并识别主题变化对于科研工作者及时获取相关领域的最新研究动态有着重要作用.针对科技文献主题多样、动态性强等特点,分析科技文献主题发现及演化具体方法,基于层次概率主题模型hLDA,采用Gibbs抽样来进行模型参数估计,并运用互信息的方法对主题词进行筛选,以提取高质量的主题词. 最后,利用先/后离散分析方法研究主题随时间的演化问题.实验结果验证了主题发现及演化方法的可行性及有效性.
主题发现、主题演化、层次概率主题模型
58
G202(信息与传播理论)
本文系国家自然科学基金青年科学基金项目“多因素融合下的微博话题可信度评估模型及实证研究”项目编号:71303179研究成果之一.
2015-01-09(万方平台首次上网日期,不代表论文的发表时间)
70-77