10.3969/j.issn.2095-2783.2011.10.009
混合口音语音识别中的声学和语音层发音变异性研究
通过在语音层使用多发音字典对完全发音变异进行建模,在声学层分别使用上下文无关部分变异音子模型(partial change phone model,PCPM)对部分发音变异进行建模,从而探究了语音层和声学层发音变异模型的特征、区别和联系,并将它们整合到语音识别系统的不同部分中,实现了对发音变异的分层处理。应用分层发音变异模型,对带方言口音汉语普通话朗读语音进行测试,提高了识别结果。最好情况下,应用多发音字典使音节准确率提高了1.24%;应用上下文无关PCPM使音节的准确率提高了9.7%。分别使用带有重庆、广州和上海口音的普通话进行实验,从实验结果对汉语不同方言口音之间发音变异的区别和关联进行了分析。
电信技术、口音语音识别、完全变异、部分变异、分层发音变异模型
6
TN912.3
高等学校博士学科点专项科研基金资助项目20090002120012
2012-04-21(万方平台首次上网日期,不代表论文的发表时间)
共7页
743-749