10.3969/j.issn.1000-386x.2015.03.008
云计算环境下基于朴素贝叶斯的数据分类
针对朴素贝叶斯分类算法的特点,提出一种改进的特征选择方法。现代大规模数据分类在单机计算机上训练和测试时间过长,对此,在 hadoop 分布式平台下设计并实现了基于朴素贝叶斯的数据分类算法。实验结果表明,改进的算法能有效提高分类的正确率,所设计的并行朴素贝叶斯数据分类算法具有较高的执行效率,适用于海量数据的处理与分析。
云计算、MapReduce、朴素贝叶斯、数据分类
TP181(自动化基础理论)
中国博士后科学基金项目20110491530;辽宁省教育厅基金项目L2011186;大连市科学技术基金项目2010J21 DW019
2015-04-03(万方平台首次上网日期,不代表论文的发表时间)
共4页
27-30