期刊专题

10.3969/j.issn.1000-386x.2016.12.032

一种基于GMM-DNN的说话人确认方法

引用
针对说话人确认中话者建模问题,提出 GMM-DNN 的混合建模方法。该方法先通过 GMM提取原始语音特征的统计特征,然后进一步通过 DNN 非线性映射的方式将统计特征变换到一个与说话人相关的线性可分空间。选用栈式自编码神经网络 SAE (Stacked Auto-encoder Neutral Network)作为深度神经网络的基本模型。在注册阶段从已训练的 DNN 网络中抽取最后一层作为说话人模型,称为 p-vector。测试阶段,通过抽取测试语音的 p-vector 与注册说话人 p-vector 进行匹配,从而作出判决;另外还详细说明了DNN 隐藏层的作用。通过对 NIST 语料库的实验表明,采用 GMM-DNN 的说话人确认方法相对于传统的 GMM-UBM话者建模方法具有一定的优势。

说话人识别、深度神经网络、高斯混合模型、统计参数

33

TP3(计算技术、计算机技术)

北京市科委项目Z141100006014002。

2017-01-16(万方平台首次上网日期,不代表论文的发表时间)

共5页

131-135

相关文献
评论
暂无封面信息
查看本期封面目录

计算机应用与软件

1000-386X

31-1260/TP

33

2016,33(12)

相关作者
相关机构

专业内容知识聚合服务平台

国家重点研发计划“现代服务业共性关键技术研发及应用示范”重点专项“4.8专业内容知识聚合服务技术研发与创新服务示范”

国家重点研发计划资助 课题编号:2019YFB1406304
National Key R&D Program of China Grant No. 2019YFB1406304

©天津万方数据有限公司 津ICP备20003920号-1

信息网络传播视听节目许可证 许可证号:0108284

网络出版服务许可证:(总)网出证(京)字096号

违法和不良信息举报电话:4000115888    举报邮箱:problem@wanfangdata.com.cn

举报专区:https://www.12377.cn/

客服邮箱:op@wanfangdata.com.cn

打开万方数据APP,体验更流畅