期刊专题

基于LSTM结合注意力机制的长文本分类优化研究

引用
文本分类是指用计算机对文本(或其他实体)按照一定的分类体系或标准进行自动分类标记.伴随着信息的爆炸式增长,人工标注数据已经变得耗时、质量低下,且受到标注人主观意识的影响.因此,利用机器自动化对文本进行标注具有一定的现实意义,将重复且枯燥的文本标注任务交由计算机进行处理能够有效克服以上问题,同时所标注的数据具有一致性、高质量等特点.其应用场景众多,包括:情感分析、主题分类、意图识别等;其分类标签可以是:情感分析(积极、消极、中性)、主题分类(历史、体育、旅游、情感)等.传统的文本分类早期是通过模式词、关键词等,同时结合一些规则策略进行.此方法的缺点很明显,人工成本高,且召回率比较低.此后,使用经典传统的机器学习方法做文本分类任务初显成效,即"特征工程+浅层分类模型",被称为传统机器学习方法.近些年,伴随深度学习的异军突起,基于深度学习的文本分类方法兴起,本文基于LSTM文本分类,针对LSTM网络结构的缺陷,引入注意力机制Attention,优化文本分类模型,在文本长度较长的情况下,效果尤为显著.

文本分类、LSTM、注意力机制、长文本

TP391.1;TP18;G434

2023-02-16(万方平台首次上网日期,不代表论文的发表时间)

共3页

90-92

相关文献
评论
暂无封面信息
查看本期封面目录

互联网周刊

1007-9769

11-3925/TP

2023,(3)

相关作者
相关机构

专业内容知识聚合服务平台

国家重点研发计划“现代服务业共性关键技术研发及应用示范”重点专项“4.8专业内容知识聚合服务技术研发与创新服务示范”

国家重点研发计划资助 课题编号:2019YFB1406304
National Key R&D Program of China Grant No. 2019YFB1406304

©天津万方数据有限公司 津ICP备20003920号-1

信息网络传播视听节目许可证 许可证号:0108284

网络出版服务许可证:(总)网出证(京)字096号

违法和不良信息举报电话:4000115888    举报邮箱:problem@wanfangdata.com.cn

举报专区:https://www.12377.cn/

客服邮箱:op@wanfangdata.com.cn

打开万方数据APP,体验更流畅