10.3969/j.issn.1000-386x.2014.09.063
基于加权补集的朴素贝叶斯文本分类算法研究
朴素贝叶斯分类方法由于其简单快速的特点,被广泛应用于文本分类领域。但是当训练集中各个类别的样本数据分布不均匀时,朴素贝叶斯方法分类精度不太理想。针对此问题,提出一种基于加权补集的朴素贝叶斯文本分类算法,该算法利用某个类别的补集的特征来表示当前类别的特征,且对特征权重进行归一化处理。通过实验对比了该方法与传统的朴素贝叶斯方法对文本分类效果的影响,结果表明,基于加权补集的朴素贝叶斯算法具有较好的文本分类效果。
文本分类、朴素贝叶斯、补集、权重
TP3(计算技术、计算机技术)
浙江省自然科学基金项目Y12F020128。
2014-10-20(万方平台首次上网日期,不代表论文的发表时间)
共3页
253-255