10.3969/j.issn.2095-2783.2015.20.004
大数据环境下最小单调约束闭包Hadoop 并行关联规则
针对传统关联规则算法存在较大规则冗余问题,提出基于最小单调约束闭包 Hadoop 并行化关联规则。首先,基于闭包算子约束规则等价关系集,给出了满足最小单调约束规则集,可有效地将约束规则集划分为不相交的等价规则类,降低冗余规则比率;其次针对大数据问题,采用 Hadoop 框架下 Mapreduce 并行计算模型,实现最小单调约束闭包关联规则的并行化计算,有效地提升算法对于大数据处理的可拓展性;最后通过在标准测试集上的实验对比,显示了所提算法的有效性。
大数据、闭包算子、最小单调约束、Hadoop 框架、关联规则、Mapreduce 并行计算
TP391(计算技术、计算机技术)
广西高校科学技术研究项目YB2014417;河南省科技计划项目142102210225
2015-12-07(万方平台首次上网日期,不代表论文的发表时间)
共6页
2356-2361