基于混合采样和改进随机森林的窃电检测
针对窃电检测中存在的数据不平衡和分类器效率低的问题,提出一种基于混合采样和随机森林的窃电检测方法.首先,用随机森林模型的误分率作为SMOTE算法的重采样率,提出E-SMOTE算法;其次,在E-SMOTE和Tome Links混合采样的过程中,引入模型ROC曲线下方的面积(area under curve,AUC)作为迭代停止的条件,实现用电数据集的平衡;最后,用基于马修斯相关系数(Matthews correlation coefficient,MCC)的置换法和卡方检验进行特征选择,并在传统的随机森林模型中引入Q统计值进行选择性集成,不仅优化属性特征的选择,还提升随机森林模型的多样性.实验结果表明:提出的混合采样算法较优于7种常用采样方法,改进的随机森林模型也在精确率、特异度和F1分数等多项指标中表现出更优的性能.
窃电检测、混合采样、特征选择、选择性集成、随机森林
49
TB9;TM933.4(计量学)
国家重点研发计划2018YFC0824XXX
2023-02-15(万方平台首次上网日期,不代表论文的发表时间)
共6页
92-97