学位专题

目录>
<

双模态语音识别的视频特征快速提取方法研究

王建蕾
长春理工大学
引用
双模态语音识别技术已成为国内外研究热点,通过将唇动信息加入到原有语音识别系统中,以提高语音识别率。本文重点研究双模态语音识别技术中视频特征的快速提取方法,采用了局部限制模型的方法(CLM)来实现。  首先建立唇部形状模型,对数据库的唇部进行标定,然后对标定数据进行Procrustes分析,并利用主成分分析算法(PCA)对Procrustes后的数据进行分析,建立唇部形状模型。其次,建立了唇部强度模型,在标定特征点周围提取图像作为训练数据,用线性支持向量机对数据进行训练来建立强度模型。最后,利用建立的模型对测试图像唇部进行特征提取。实验结果表明,CLM可实现唇部特征的提取工作,选用的19个特征点唇部标定方案相比以往标定方法可更快速地提取唇部特征。

双模态语音识别技术;视频特征;局部限制模型;唇部形状模型;主成分分析算法

长春理工大学

硕士

模式识别与智能系统

王丽荣

2013

中文

TN912.34

42

2014-09-17(万方平台首次上网日期,不代表论文的发表时间)

相关文献
评论
相关作者
相关机构
打开万方数据APP,体验更流畅