10.3969/j.issn.2095-2163.2019.04.018
基于条件深度卷积生成对抗网络的语音增强研究
语音交互技术日益在现实生活中得到广泛的应用,由于干扰的存在,现实环境中的语音交互技术远没有达到令人满意的程度.为了提高现实环境中语音交互性能,本文提出了一种基于条件深度卷积生成对抗网络(C-DCGAN)的语音增强模型,这是在GAN的基础上加入卷积层和条件信息.C-DCGAN利用卷积层提取语音特征,同时利用条件信息,生成高质量的语音.通过TIMIT数据集、NOISEX-92噪声库、Aurora2噪声库及环境噪声数据集对所提出的语音增强模型进行验证.结果表明,与谱减法、DNN等语音增强方法相比,C-DCGAN模型在PESQ和STOI指标上均有提高,表明本文提出的模型能取得良好的语音增强效果.
语音增强、条件卷积生成对抗网络、深度学习、带噪语音
9
TP391(计算技术、计算机技术)
2019-08-19(万方平台首次上网日期,不代表论文的发表时间)
共5页
82-86