10.19665/j.issn1001-2400.2019.04.018
一种时频平滑的深度神经网络语音增强方法
由于现有的基于深度神经网络的语音增强方法在网络结构的设计上缺乏对语音增强问题自身特点的考虑,针对这一问题,基于语音增强在时间和频率两个维度上的不同特性,受传统语音增强方法中的含噪语音局部特征计算方法启发,设计了一种在时间和频率两个维度上进行不同处理的时频平滑网络.该网络采用门控循环单元来表达含噪语音在时间上的相关性,同时采用卷积神经网络来表达含噪语音在频率上的相关性,实现了类似传统语音增强方法的时频平滑处理.实验结果表明,这种时频平滑网络在保证语音增强系统因果性的前提下,相比其他网络显著地提高了语音增强性能,增强后的语音具有更好的语音质量和可懂度.
语音增强、时频平滑、卷积神经网络、深度神经网络
46
TN912.3
国家自然科学基金青年基金61701286,11704229;山东省自然科学基金ZR2015FL003,ZR2017MF047,ZR2017LA011, ZR2018LF002
2019-08-27(万方平台首次上网日期,不代表论文的发表时间)
共7页
130-136