语音参数轨迹模型研究及其在可信度度量中的应用

张翼燕

中国科学院自动化研究所

下载全文

在线阅读

引用

摘要：

迄今为止,在连续语音识别领域应用最成功最广泛的是HMM模型.为了获得高效的训练和识别算法,HMM假设特征之间相互独立,这是不符合语音信号的实际分布的.为此研究者们解除独立性假设,提出了更一般的模式——分段模型.该文对参数轨迹模型进行了全面的研究和深入的探讨,包括声调结合建模、搜索问题,以及它们的可信度度量工作等.主要贡献如下:●完成了参数轨迹模型系统的实现,对模型的概率表达方式进行了分析.当多项式拟合阶数退化为0时,它相当于精确时长建模的HMM.在分段模型实验中,从数据拟合的角度验证了参数轨迹模型比起HMM模型具有更加精确的建模能力.参数轨迹模型方法对静音建模时存在着理论缺陷,我们设想静音有一条期望的直线轨迹来实现其参数轨迹的建模.同时发现,时长模型对小帧数静音的识别非常重要;●探讨了结合声调特征的参数轨迹建模.它的软结合方法在特征层把基频作为第14维特征,对其进行轨迹拟合后得到的是这段语音的声调.参数轨迹模型的物理意义决定了它能直接反映基频曲线在空间的分布特性.硬结合方法在模型层将声调模型与声学模型相结合,利用的是参数轨迹模型作为分段模型的特性:它的框架结构在进行统计识别时可以很好地结合段特征.●参数轨迹模型获得了比HMM模型更加精确的建模能力,这是以计算复杂度增加为代价的.为了解决这个问题,提出了定长参数轨迹模型方法.它将归一化时间轨迹上的点重采样到固定的区域中,避免了不同时间点在不同段中的重复概率计算.论文还对模型实现过程中遇到的句子得分归一化等问题进行了处理.定长参数轨迹模型在数字串识别率略有下降(0.5﹪)的情况下,计算时间降低了90倍左右;●提出了参数轨迹模型和HMM模型相结合可信度度量方法,克服了传统可信度方法的不足.具体的方法有两种,一是得分的应用,可以和HMM得分相结合或者替代HMM得分使用,一方面引入了新的信息,另一方面改善了HMM对语音信号描述不够准确的缺陷;二是模型的融合,在同一系统中出现了两种不同的声学模型,它们提供了各自的识别结果相互验证.这样做避免了采用似然得分所带来的种种问题,在不同的句子间可以相互比较.在搜索阶段,对词图中要进行回溯的语音段提供新的声学模型(参数轨迹模型)识别,原HMM的识别结果在这个新的序列中所处的位置不同,其得到的可信度支持也不同,从而改变路径回溯的优先顺序,提高系统的识别率.在假设检验阶段,提出参数轨迹模型校验的拒识方法,在此基础上,为了满足系统提出的对评价指标的不同要求,增加了Fisher分类器后处理部分,并引入参数轨迹模型得分作为新的特征输入.通过对参数轨迹模型校验和得分的同时运用,取得了较好的接受/拒识性能.

关键词：语音识别;参数轨迹模型;搜索;可信度度量

授予单位：中国科学院自动化研究所

授予学位：博士

学科专业：模式识别与智能系统

导师姓名：徐波;刘文举

学位年度：2003

语种：中文

分类号：TN912.34

页数：123

在线出版日期：2005-05-24（万方平台首次上网日期，不代表论文的发表时间）

个人中心

我的学术圈

我的书案

退出

学位专题

语音参数轨迹模型研究及其在可信度度量中的应用