10.3969/j.issn.1000-386x.2014.08.072
一种子空间聚类算法在多标签文本分类中应用
随着社交网络的兴起,文本数据不断增加,这使得自动化文本分类技术成为研究的热点.单个文本可能同时带有多个类别标签,该特点直接导致传统的二分类或多类别分类技术在多标签文本数据上性能不佳.针对这一不足,提出一种基于半监督杂质的子空间聚类分析算法SCA(subspace clustering analysis),该算法分析在多标签环境下每一对分类和标签之间存在的潜在相关性.并设计一种对分类文本数据更有效的多标签分类器.最后,实验对两个多标签文本集进行分析,结果表明该算法优于当前采用的其他文本分类方法.
文本数据、多标签、分类器、子空间聚类、杂质
31
TP311.1(计算技术、计算机技术)
2014-10-09(万方平台首次上网日期,不代表论文的发表时间)
共5页
288-291,303