DOI：10.3969/j.issn.1000-386x.2020.11.044

基于多尺度残差深度卷积神经网络的语音识别

引用

摘要：

针对卷积神经网络在连续语音识别中识别性能较差的问题,提出多尺度残差深度卷积神经网络的语音识别的算法,并结合联结时序分类算法,构建端到端中文语音识别系统.将多尺度学习和残差机制以及空洞卷积引入到神经网络中,摆脱序列建模对长短时记忆神经网络的依赖,提高模型的训练速度,增强语音识别的抗噪声干扰性.实验表明,与双向长短时记忆模型(BLSTM)、深度卷积神经网络模型(DCNN)和卷积神经网络-长短时记忆模型(CNN-LSTM)相比,该模型的字错误率WER(Word Error Rate)分别降低了9％、5％和3％左右,且在噪声环境下的识别率也优于传统的语音识别系统.

关键词：语音识别、多尺度、卷积神经网络、端到端

所属期刊栏目：37

分类号：TP3;TN912.34(计算技术、计算机技术)

在线出版日期：2020-11-18（万方平台首次上网日期，不代表论文的发表时间）

页数：共5页

页码：275-279

英文信息展示

个人中心

我的学术圈

我的书案

退出

期刊专题

基于多尺度残差深度卷积神经网络的语音识别