10.3969/j.issn.1000-386x.2017.03.037
基于并行化递归神经网络的中文短文本情感分类
情感分析的一个重要应用是判断用户对于产品评论的情感倾向,这些用户评论一般都是字数较少的短文本.传统方法多利用词袋模型获取单词的浅层特征来进行情感分析,利用这些简单特征训练的模型在短文本,尤其是在复杂语法问题上效果并不理想.通过利用深度递归神经网络算法来捕获句子语义信息,并引入中文"情感训练树库"作为训练数据来发现词语情感信息,在短文本情感五分类的问题上取得了较高的准确率.针对复杂模型在海量数据训练上的时间效率问题,通过在Spark并行框架下实现了模型的并行化处理,使得模型的可扩展性和时间效率得到提升.
深度学习、情感分析、文本分类、Spark
34
TP3(计算技术、计算机技术)
国家自然科学基金项目61402008,61402009;安徽省科技重大专项16030901060;安徽高校省级自然科学研究重大项目KJ2014ZD 05;安徽省高校优秀青年人才支持计划
2017-05-08(万方平台首次上网日期,不代表论文的发表时间)
共8页
205-211,232