10.3969/j.issn.1000-386x.2020.11.044
基于多尺度残差深度卷积神经网络的语音识别
针对卷积神经网络在连续语音识别中识别性能较差的问题,提出多尺度残差深度卷积神经网络的语音识别的算法,并结合联结时序分类算法,构建端到端中文语音识别系统.将多尺度学习和残差机制以及空洞卷积引入到神经网络中,摆脱序列建模对长短时记忆神经网络的依赖,提高模型的训练速度,增强语音识别的抗噪声干扰性.实验表明,与双向长短时记忆模型(BLSTM)、深度卷积神经网络模型(DCNN)和卷积神经网络-长短时记忆模型(CNN-LSTM)相比,该模型的字错误率WER(Word Error Rate)分别降低了9%、5%和3%左右,且在噪声环境下的识别率也优于传统的语音识别系统.
语音识别、多尺度、卷积神经网络、端到端
37
TP3;TN912.34(计算技术、计算机技术)
2020-11-18(万方平台首次上网日期,不代表论文的发表时间)
共5页
275-279