10.3969/j.issn.0372-2112.2018.01.019
基于三支决策的不平衡数据过采样方法
采样是解决不平衡数据分类问题的一个有效途径.文中结合三支决策理论,根据样本分布将样本划分成三个区域:正域、边界域和负域;在此基础上,分别对边界域和负域中的小类样本进行不同的过采样处理,提出了一种基于三支决策的不平衡数据过采样算法(TWD-IDOS算法).实验结果表明,在C4.5、KNN和CART等分类器上,文中提出的算法能有效解决不平衡数据的二分类问题,在Recall、F-value、AUC等指标上优于文献中的过采样算法.
三支决策、邻域粗糙集、边界采样、不平衡数据、SMOTE
46
TP39(计算技术、计算机技术)
国家自然科学基金61309014,61379114,61472056;教育部人文社科规划15XJA630003;重庆市基础与前沿研究计划cstc2013jcyjA40063,cstc2014jcyjA40049;重庆市教委科学技术研究KJ1500416
2018-07-02(万方平台首次上网日期,不代表论文的发表时间)
共10页
135-144