10.3969/j.issn.1000-386X.2007.09.068
基于Bootstrap Averaging的贝叶斯分类算法
针对单词簇上训练朴素贝叶斯文本分类器概率估计偏差较大所导致的分类精度较低问题.在使用概率分布聚类算法得到的单词簇的基础上,根据单词与簇间互信息建立有序单词子序列,采用有放回随机抽样对单词序列构造规模相当的样本集并将估计出的参数的平均值作为训练得到的最终参数对未知文本进行分类.公共文本实验数据集上的实验结果表明,提出的训练方法相对于传统的朴素贝叶斯分类器训练方法能够获得更高的分类精度且过程相对简单.
概率分布聚类、文本分类、朴素贝叶斯分类器、自助平均
24
TP3(计算技术、计算机技术)
河南省科技攻关项目052400005
2007-10-29(万方平台首次上网日期,不代表论文的发表时间)
共3页
189-190,199