10.3969/j.issn.1673-5439.2012.05.024
基于文本特征分析的钓鱼邮件检测
提出了一种基于邮件文本特征的钓鱼邮件检测方法.首先利用邮件解析器将邮件中非文本部分内容剔除,然后提取邮件剩余部分中存在的网站链接及其他内容,并在此基础上提取10种特征.针对这些特征,利用机器学习方法对其进行训练和预测,将邮件分类为普通邮件和钓鱼邮件.我们改进了以往一些针对网站链接分析的检测方法,并结合钓鱼邮件发展的新趋势,提出了6种新的特征.实验证明,本方法结合了新的钓鱼邮件特征,有效地提高了钓鱼邮件检测的召回率以及精准率,同时误判率有所降低.并且,本方法稍加改进以后就能用于钓鱼网站的检测.
钓鱼检测、邮件、文本特征、网页链接
32
TP393.08(计算技术、计算机技术)
江苏省青蓝工程、武汉大学软件工程国家重点实验室开放基金BJ2110002;桂林电子科技大学广西可信软件重点实验室开放基金TJ211037;苏州大学江苏省计算机信息处理技术重点实验室KJS0714
2013-01-21(万方平台首次上网日期,不代表论文的发表时间)
共6页
140-145