学位专题

<
DOI:10.7666/d.y703492

基于数据挖掘的邮件分类识别研究

李洋
重庆大学
引用
本文在贝叶斯过滤技术的启发下,选择数据挖掘的方法来研究一种具有学习能力的邮件过滤技术.近年来数据挖掘技术被广泛应用到了诸多领域,引起了学术界极大的关注.数据挖掘是一个决策支持过程,基础是人工智能.目前数据挖掘主要利用人工智能中的一些算法和技术,包括决策判定树、人工神经网络技术等来进行预测、模式识别、分类和聚类分析等.本文通过对电子邮件的分析和研究,提出对邮件结构字段信息和邮件正文信息加以离散和特征化处理,用向量的方式表示电子邮件;接着针对向量化的邮件表示,建立了一种基于信息熵的决策树邮件分类识别模型;论文最后通过编程对该模型作了一系列的实验和测试.实验证明,该模型能从邮件结构字段信息和邮件正文信息中,学习归纳出能识别垃圾邮件的知识和方法,表明本文提出的基于决策树理论的邮件分类模型是可行和有效的,并具有良好的效果.

决策树;信息增益;数据挖掘;垃圾邮件

重庆大学

硕士

计算机系统结构

王康

2004

中文

TP311.13;F618.1

51

2005-08-22(万方平台首次上网日期,不代表论文的发表时间)

相关文献
评论
相关作者
相关机构
打开万方数据APP,体验更流畅