10.3969/j.issn.1000-386X.2010.01.035
基于中文变形词匹配的贝叶斯邮件过滤模型
针对特征词变异的中文垃圾邮件问题,提出了一种基于变形特征词匹配还原的新贝叶斯邮件过滤算法.改进的模型能自动发现邮件中的变异特征词,并根据对应的变异类型还原算法将其还原,避免了变异特征词的匹配逃脱.算法提高了对于含有拼音替换、同音字替换、符号插入等变形特征词样本的分类准确率.实验表明,改进的过滤算法比普通贝叶斯算法有更好的性能.
贝叶斯、垃圾邮件过滤、变形特征
27
TP3;X70
浙江省自然科学基金项目Y106176;浙江省科技厅计划项目2007C33058
2010-04-06(万方平台首次上网日期,不代表论文的发表时间)
共4页
105-107,130