10.3969/j.issn.1674-3229.2019.04.006
基于SMOTE的机器学习算法准确度影响研究
随着互联网的发展,大数据时代的到来,各个领域都存储了海量的数据,为机器学习的分析与预测提供了必要条件,但非平衡数据广泛存在于各个领域,例如电话欺诈、网络欺骗、医学诊断等.在机器学习中,一般用预测准确度来评估分类器的好坏,但在样本不均衡且正负比例差异显著时,这种评估方式显然是不合适的.以KNN算法为例,对比它在应用SMOTE样本均衡算法前后的预测准确度的差异,同时用ROC曲线对算法在样本均衡化前后的效果各个维度进行了详细对比,模型预测效果均比之前有了显著提升.
机器学习、样本均衡算法、ROC
19
TP301.6(计算技术、计算机技术)
2020-03-18(万方平台首次上网日期,不代表论文的发表时间)
共3页
27-29