10.3969/j.issn.1000-386x.2020.09.049
基于mRMR-RF特征选择和XGBoost模型的钓鱼网站检测
针对大量冗余数据带来的钓鱼网站检测准确率不够、误判率较高等问题,提出一种基于最大相关最小冗余(mRMR)和随机森林(RF)相结合的特征选择方法(mRMR-RF),并利用极端梯度提升(XGBoost)算法构建钓鱼网站检测模型.利用mRMR和RF算法分别对特征进行排序;综合两种特征排序得出最终的排序结果,并根据实验得出的最佳特征数选出XGBoost模型所需的最优特征子集;使用最优特征子集对XGBoost分类模型进行训练.实验结果表明,该方法相比其他分类方法可以提高钓鱼网站检测的准确率,具有实际意义.
特征选择、最大相关最小冗余、随机森林、XGBoost、钓鱼网站
37
TP301.6(计算技术、计算机技术)
江苏省研究生科研与实践创新计划项目KYCX19-0874
2020-09-17(万方平台首次上网日期,不代表论文的发表时间)
共6页
296-301