期刊专题

10.14132/j.cnki.1673-5439.2019.03.013

一种基于聚类约简决策树的改进随机森林算法

引用
传统随机森林算法为了提高分类准确率,常常需要构建大量的决策树模型.由于训练数据集的复杂性以及传统随机森林在构建过程中引入的随机性,算法在训练过程中会生成部分分类性能差和相似度较高的决策树,影响模型的整体分类性能.针对这个问题,提出一种基于决策树聚类的改进随机森林算法(Trees Clustering Random Forest,TCRF),从分类精度和相似性角度去除不合格的决策树,根据AUC值从原始森林中提取出相对高精度子森林,利用基于Kappa统计量的距离度量方法对子森林聚类,从划分出的簇中选取具有代表性的树组成高精度低相似的森林.实验结果证明:改进后的算法在集成准确率以及分类效率上要高于传统随机森林算法.

随机森林、分类精度、相似性、聚类

39

TP301(计算技术、计算机技术)

2019-07-23(万方平台首次上网日期,不代表论文的发表时间)

共7页

91-97

相关文献
评论
暂无封面信息
查看本期封面目录

南京邮电大学学报(自然科学版)

1673-5439

32-1772/TN

39

2019,39(3)

相关作者
相关机构

专业内容知识聚合服务平台

国家重点研发计划“现代服务业共性关键技术研发及应用示范”重点专项“4.8专业内容知识聚合服务技术研发与创新服务示范”

国家重点研发计划资助 课题编号:2019YFB1406304
National Key R&D Program of China Grant No. 2019YFB1406304

©天津万方数据有限公司 津ICP备20003920号-1

信息网络传播视听节目许可证 许可证号:0108284

网络出版服务许可证:(总)网出证(京)字096号

违法和不良信息举报电话:4000115888    举报邮箱:problem@wanfangdata.com.cn

举报专区:https://www.12377.cn/

客服邮箱:op@wanfangdata.com.cn

打开万方数据APP,体验更流畅