基于神经网络和集成学习的文本情感分析研究

罗思吟

武汉工程大学

下载全文

在线阅读

引用

摘要：

如何有效地表示文本语义特征以及挖掘文本潜在的情感极性一直是文本情感分析领域的重点研究内容。传统情感词典的方法往往需要人工构造大量情感词汇，分类精度取决于情感词典的完备程度。但成熟的情感词典数量很少，构建一部情感词典既费时又费力。足量有标签的训练数据是使用机器学习进行情感分析的基础，训练数据不足或严重偏置会导致分类器失效。使用深度学习进行情感分析可以通过多层神经网络自动捕获数据特征，提高了文本分析正确性，但单一的分类模型可能存在分类不稳定的情况。　　针对上述问题，本文提出了一种联合神经网络和集成学习的情感分析方法。首先选取两个不同类型的中英文数据集，对文本预处理并生成向量化表示，结合Doc2vec方法进行特征提取，再使用支持向量机（SVM）、长短时记忆网络（LSTM）、卷积神经网络（CNN）以及卷积神经网络和长短时记忆网络的联合模型（CNN-BiLSTM）四种基分类器分别进行模型训练。为了解决模型复杂性高但分类准确性得不到提升的瓶颈，引入Stacking集成学习思想，提出了融合四个基分类器的Stacking异质集成模型，并与参考文献中提到的其它基准模型进行对比实验，验证了基于Stacking的异质集成模型可以有效地提升分类效果。　　实验结果表明，基于Stacking的异质集成模型能够有效地提升文本情感分析的准确率。本文提出的基于Stacking的集成模型在IMDB数据集上的分类精度达到了97.66%，在微博评论数据集上的分类精度达到了94.24%，相比其他传统分类模型表现更好，说明了本文提出模型的可行性及有效性。

关键词：文本信息;情感分析;神经网络;集成学习

授予单位：武汉工程大学

授予学位：硕士

学科专业：计算机应用技术

导师姓名：姚兴兴

学位年度：2022

语种：中文

分类号：TP391.1

在线出版日期：2022-12-23（万方平台首次上网日期，不代表论文的发表时间）

个人中心

我的学术圈

我的书案

退出

学位专题

基于神经网络和集成学习的文本情感分析研究