10.3969/j.issn.1000-386X.2011.04.038
基于二次TF*IDF的互信息文本特征选择算法研究
在分析传统互信息法缺陷的基础上,提出一种基于二次TF*IDF的互信息特征选择算法,对仅在一个类别中出现的特征词的重要程度给予再次的衡量,解决了互信息值相等而无法进行有效特征选择的问题.利用贝叶斯分类器对该方法进行验证的结果表明该算法在文本分类效率和正确率上比原有方法有一定的提高.
特征选择、文本分类、互信息、TF*IDF
28
TP3;D6
全国高等教育研究中心2008年度国家级教学改革基金FIB070335-A8-16
2011-08-04(万方平台首次上网日期,不代表论文的发表时间)
共3页
129-131