10.3969/j.issn.1002-0640.2012.05.014
不平衡数据的软件缺陷预测方法
数据的不平衡问题是数据分类领域中的一个热点问题.当分类算法处理这些数据时,算法将偏向多数类而忽视少数类.在软件缺陷预测领域,它并没有引起足够的重视,在4组NASA不平衡数据上比较和分析了14种分类算法的性能,为了克服数据的不平衡性.采用SMOTE技术对软件缺陷数据进行平衡化,最后在AUC和F-measure评价指标下对算法进行评估.实验结果表明随机森林算法在4组数据上表现最佳,这为软件缺陷预测提供了很好的参考.
软件缺陷、预测、度量元、不平衡数据
37
TP182(自动化基础理论)
国防重点基金
2012-07-27(万方平台首次上网日期,不代表论文的发表时间)
共4页
56-59