基于二维非负矩阵分解的1kb/s WI语音编码算法
本文针对波形内插(WI)语音编码模型和参数量化等技术进行了研究,并最终提出了一种基于二维非负矩阵分解的1kb/s波形内插(2DNMF-WI)语音编码算法.文中采用二维非负矩阵分解(2D-NMF)方法来分解语音特征波形(CW),该分解方法在行和列两个方向上同时压缩CW幅度谱矩阵的维数,使得CW幅度谱矩阵降维后得到的编码矩阵维数较小,易于量化.此外,在甚低速率语音编码中,由于没有足够的比特数来描述编码参数,往往很难得到高质量的合成语音.本算法采用两帧联合编码、帧间后向预测三级矢量量化、离散余弦变换(DCT)和分裂式矩阵量化等技术来降低编码速率和改善音质.非正式主观听觉测试显示,1kb/s 2DNMF-WI编码器合成语音的质量稍差于2kb/s的NMF-WI语音编码算法.
语音编码、波形内插、特征波形、二维非负矩阵分解、两帧联合
38
TN912.3
北京市教委科技发展计划KM200710005001;国家自然科学基金60372063;北京市自然科学基金4042009;北京市属高校人才强教计划
2010-09-10(万方平台首次上网日期,不代表论文的发表时间)
共6页
1574-1579