10.3969/j.issn.1000-386X.2012.01.048
基于聚类分析的图模型文档分类
针对传统向量空间模型中的特征项孤立处理问题,首先通过x2统计和特征聚类相结合的模式实现特征降维,然后使用图模型来建立词和词之间相互关联信息,最后运用KNN方法进行文档分类测试.该算法提高了稀有词对分类的贡献,强化了关联词的分类效果,并降低了文档向量的维数.实验证明,该算法提高了分类的准确率和召回率.
聚类分析、图模型、文档分类
29
TP301(计算技术、计算机技术)
2012-04-27(万方平台首次上网日期,不代表论文的发表时间)
共5页
171-174,229