10.3969/j.issn.1004-9398.2014.06.004
基于改进Single-Pass算法的BBS热点话题发现
详细介绍了经典增量式聚类算法Single-Pass的特点,针对该算法中“聚类质心不唯一”的缺陷提出“设定唯一聚类质心”的改进方案,降低了算法的时间复杂度;针对“算法聚类中心随机性强”的不足提出了“不断优化聚类中心”的改进方案,使得聚类中心的代表性更强.最后,基于“中华网BBS”文本数据对改进后的算法进行验证、分析,并与经典Single-Pass算法的聚类结果进行对比,得到了更为理想的实验结果,表明算法可行有效.
Single-Pass、文本聚类、热点话题发现
35
G35(情报学、情报工作)
2015-01-09(万方平台首次上网日期,不代表论文的发表时间)
共5页
13-17