DOI：10.3969/j.issn.2095-2163.2019.04.018

基于条件深度卷积生成对抗网络的语音增强研究

引用

摘要：

语音交互技术日益在现实生活中得到广泛的应用,由于干扰的存在,现实环境中的语音交互技术远没有达到令人满意的程度.为了提高现实环境中语音交互性能,本文提出了一种基于条件深度卷积生成对抗网络(C-DCGAN)的语音增强模型,这是在GAN的基础上加入卷积层和条件信息.C-DCGAN利用卷积层提取语音特征,同时利用条件信息,生成高质量的语音.通过TIMIT数据集、NOISEX-92噪声库、Aurora2噪声库及环境噪声数据集对所提出的语音增强模型进行验证.结果表明,与谱减法、DNN等语音增强方法相比,C-DCGAN模型在PESQ和STOI指标上均有提高,表明本文提出的模型能取得良好的语音增强效果.

关键词：语音增强、条件卷积生成对抗网络、深度学习、带噪语音

所属期刊栏目：9

分类号：TP391(计算技术、计算机技术)

在线出版日期：2019-08-19（万方平台首次上网日期，不代表论文的发表时间）

页数：共5页

页码：82-86

英文信息展示

个人中心

我的学术圈

我的书案

退出

期刊专题

基于条件深度卷积生成对抗网络的语音增强研究