10.3969/j.issn.1001-4616.2016.04.006
基于Hadoop平台的SPRINT算法的分析与研究
传统的决策树算法在单机平台上处理海量数据挖掘时,容易受到计算能力和存储能力的限制,所以存在耗时过长、容错性差、存储量小的缺点.而拥有高可靠性和高容错性的Hadoop平台的出现为决策树算法的并行化提供了新的思路.本文设计和实现了一种基于Hadoop平台的并行SPRINT分类算法.实验结果表明:基于Hadoop平台的SPRINT分类算法比没有进行并行化的SPRINT算法具有较好的分类正确率、较低的时间复杂度和较好的并行性能,并且能明显提高算法求最佳分裂点时的执行速度.
Hadoop、MapReduce、数据挖掘、决策树、SPRINT算法
39
TP301.6(计算技术、计算机技术)
国家自然科学基金61171053
2017-04-24(万方平台首次上网日期,不代表论文的发表时间)
共6页
25-30