学位专题

目录>
<
DOI:10.7666/d.D380780

MMCE算法在因子分析概率统计模型中的应用

吴延渠
湘潭大学
引用
在说话人识别领域中,基于模型的方法是最有效的,概率统计模型属于该类方法,GMM和HMM都是典型的概率统计模型,目前,受到十分广泛的研究,具有越来越重要的研究意义和实用价值。  近年,说话人概率统计模型成为研究领域的一大热点。然而,基于这类模型建立的说话人识别系统在应用于实际环境中时还存在很多难题:特征矢量存在帧内相关;大文本情况下模型参数过多且不能很好分类;计算复杂系统开销大以及训练速度慢;训练算法分类优化程度不够以及不灵活等。针对上述问题,开展了下述工作:  在对说话人识别最常用的两种概率统计模型:高斯混合模型(GMM)和隐马尔可夫模型(HMM)进行综述的基础上,对其中基本算法的优缺点进行了深入的研究和分析。详细分析最小分类错误算法(MCE)的优缺点,针对现在GMM和HMM训练中普遍用到的MCE算法存在的问题,尝试性地提出相应的改进算法MMCE,即通过一个有序排列组来代替损失函数的重复判别,以便增加训练灵活性,避免复杂而重复的比较计算。  对MMCE算法的实现和参数调解过程进行推导,论述因子分析方法与GMM/HMM结合成因子分析高斯混合(FAGMM)和因子分析隐马尔可夫模型(FAHMM)的过程和概念;推导出因子分析模型的EM训练算法和MMCE训练算法;实现了MMCE和FAGMM/FAHMM的结合,于是就形成新的FAGMM+MMCE和FAHMM+MMCE模型。  基于50个人语音库的说话人实验表明:MMCE算法较MCE和EM训练时,模型的识别性能更好,训练速度更快。另外,对FAGMM+MMCE和FAHMM+MMCE模型的抗噪声性能研究的实验中证明:在不同信噪比的白噪声、各类常见的真实噪声环境下,模型取得比较好的抗噪声性能,而且优于其它的方法。  本文将因子分析方法和MMCE算法结合用于GMM/HMM,形成新的FAGMM/FAHMM模型,不仅提高了识别率,加快了训练速度,而且抗噪声性能更优越,具有一定的实际意义。

说话人识别系统;因子分析;概率统计模型;最小分类错误算法;抗噪声性能

湘潭大学

硕士

物理电子学

曾以成

2009

中文

TN912.34

61

2014-01-22(万方平台首次上网日期,不代表论文的发表时间)

相关文献
评论
相关作者
相关机构
打开万方数据APP,体验更流畅