10.3969/j.issn.1001-2400.2016.02.018
正则化分段区分性特征变换方法
针对基于分帧特征变换稳定性不够的问题,提出了一种分段的区分性特征变换方法,并采用正则化方法确定出每一语音段的特征变换矩阵.该方法将特征变换视为数据受限条件下的参数选择问题,在训练阶段,采用状态绑定的方式训练得到区域相关线性变换特征变换矩阵,将所有的变换矩阵构成一个过完备字典;在测试阶段,采用强制对齐的方式对语音进行分段,在似然度目标函数中加入正则项,利用快速迭代收敛阈值算法进行求解,在求解过程中从字典里确定出最佳的特征变换矩阵子集及其组合系数.实验结果表明,结合L1和L2正则化,相比于状态绑定的区域相关线性变换方法,当声学模型采用最大似然准则训练时,识别率可以提高1.30%;模型区分性训练后,识别性能提升了1.66%.
特征变换、语音识别、域划分、正则化、区分性训练
43
TN912.3
国家自然科学基金资助项目61175017 ,61403415;国家863计划资助项目2012AA011603
2016-05-19(万方平台首次上网日期,不代表论文的发表时间)
共6页
102-107