10.3969/j.issn.1000-386x.2020.06.024
Spark在集成学习文本情感分析中的应用
针对使用集成学习方法进行大规模文本情感分析实验中计算时间瓶颈的问题,提出基于Spark平台的集成学习模型并行化算法.使用三个数量级的文本进行集成学习的对比实验.结果表明,该算法大幅缩短了文本分类时间,F-score等相关评价指标与单机版本接近,且算法的可拓展性良好,大幅降低了模型优化和调参的时间成本.
Spark、分布式计算、模型并行化、集成学习、文本情感分析
37
TP3(计算技术、计算机技术)
2020-06-28(万方平台首次上网日期,不代表论文的发表时间)
共5页
130-134