双模态语音识别的视频特征快速提取方法研究

王建蕾

长春理工大学

下载全文

在线阅读

引用

摘要：

双模态语音识别技术已成为国内外研究热点，通过将唇动信息加入到原有语音识别系统中，以提高语音识别率。本文重点研究双模态语音识别技术中视频特征的快速提取方法，采用了局部限制模型的方法(CLM)来实现。　　首先建立唇部形状模型，对数据库的唇部进行标定，然后对标定数据进行Procrustes分析，并利用主成分分析算法(PCA)对Procrustes后的数据进行分析，建立唇部形状模型。其次，建立了唇部强度模型，在标定特征点周围提取图像作为训练数据，用线性支持向量机对数据进行训练来建立强度模型。最后，利用建立的模型对测试图像唇部进行特征提取。实验结果表明，CLM可实现唇部特征的提取工作，选用的19个特征点唇部标定方案相比以往标定方法可更快速地提取唇部特征。

关键词：双模态语音识别技术;视频特征;局部限制模型;唇部形状模型;主成分分析算法

授予单位：长春理工大学

授予学位：硕士

学科专业：模式识别与智能系统

导师姓名：王丽荣

学位年度：2013

语种：中文

分类号：TN912.34

页数：42

在线出版日期：2014-09-17（万方平台首次上网日期，不代表论文的发表时间）

个人中心

我的学术圈

我的书案

退出

学位专题

双模态语音识别的视频特征快速提取方法研究