基于GMM的声音信号分类器研究

王志强

中国科学院自动化研究所

下载全文

在线阅读

引用

摘要：

该文将详细介绍作者攻读硕士学位期间在基于高斯混合模型(GMMs)的声音信号分类器方面的一些工作.我们首先研究了今年来基于声纹的说话人识别技术,特别是文本无关的说话人识别.在分析了对说话人识别效果影响的一些因素的基础上,建立了一个文本无关的说话人识别系统.并针对现有建模技术对距离度量的不合理性,以及对数据间共有信息的忽视,提出了基于方差共享的结构聚类方法,挖掘了相近类中数据所包含的共有信息,更为有效地刻画了数据的分布状况.这个方法在一定程度上解决了数据稀疏问题.其次,基于GMM的说话人识别系统框架和技术,研制开发了油田管道声音信号监测系统.该系统在实际使用中取得了较好的效果.再次,在油田管道声音信号分类系统开发过程中,采集并建立了大量的现场信号,为声音信号的进一步分析提供了数据保障.该文提出的各种算法和以及改进都在实际信号中作了大量测试验证其效果,并在试验后作了有针对性的分析.

关键词：语音识别技术;模式识别;高斯混合模型;MFCC

授予单位：中国科学院自动化研究所

授予学位：硕士

学科专业：模式识别与智能系统

导师姓名：徐波

学位年度：2003

语种：中文

分类号：TN912.34;TE832.2

页数：68

在线出版日期：2004-06-15（万方平台首次上网日期，不代表论文的发表时间）

个人中心

我的学术圈

我的书案

退出

学位专题

基于GMM的声音信号分类器研究