统计流形上基于核近邻算法的文本分类研究
为了更加高效地对文本数据进行描述,提出将文本向量表示为统计流形上的点,并用核方法将文本的生成模型和判别模型结合起来.用DCM统计流形上扩散核来表示文本空间上的距离度量,提出DCM流形上的核近邻算法用于文本分类.实验结果表明,在两个实验语料库上基于DCM流形的核近邻算法的准确率和召回率优于对比算法或与对比算法相当.
扩散核、核近邻、狄利克雷混合多项式、文本分类
30
TP391.1(计算技术、计算机技术)
国家部委预研项目504-4
2010-05-17(万方平台首次上网日期,不代表论文的发表时间)
共5页
315-319