10.3969/j.issn.1000-386x.2023.06.019
融合LC-Transformer XL文本分类的集成模型
针对文本分类任务中存在数据稀疏、无法捕捉段与段之间的更长距离依赖关系问题,提出一种LC-Transformer XL集成模型.通过LDA主题模型单词与主题的概率分布,对文本进行高频关键词提取,采用CNN算法提取局部特征向量,利用Transformer-XL模型的相对位置编码和循环机制得到全局语义特征,将其提取的局部与全局特征向量融合,在此基础上,通过Softmax分类器进行分类,得到文本分类的结果.实验表明,该模型在THUCNews中文文本数据集上的F1 值达到0.931 8,准确率达到94.15%,在处理文本分类任务中有较好的表现.
文本分类、LDA主题模型、卷积神经网络、Transformer-XL、集成模型
40
TP3(计算技术、计算机技术)
国家自然科学基金61672337
2023-07-10(万方平台首次上网日期,不代表论文的发表时间)
共7页
118-123,132