基于二维非负矩阵分解的1kb/s WI语音编码算法

引用

摘要：

本文针对波形内插(WI)语音编码模型和参数量化等技术进行了研究,并最终提出了一种基于二维非负矩阵分解的1kb/s波形内插(2DNMF-WI)语音编码算法.文中采用二维非负矩阵分解(2D-NMF)方法来分解语音特征波形(CW),该分解方法在行和列两个方向上同时压缩CW幅度谱矩阵的维数,使得CW幅度谱矩阵降维后得到的编码矩阵维数较小,易于量化.此外,在甚低速率语音编码中,由于没有足够的比特数来描述编码参数,往往很难得到高质量的合成语音.本算法采用两帧联合编码、帧间后向预测三级矢量量化、离散余弦变换(DCT)和分裂式矩阵量化等技术来降低编码速率和改善音质.非正式主观听觉测试显示,1kb/s 2DNMF-WI编码器合成语音的质量稍差于2kb/s的NMF-WI语音编码算法.

关键词：语音编码、波形内插、特征波形、二维非负矩阵分解、两帧联合

所属期刊栏目：38

分类号：TN912.3

资助基金：北京市教委科技发展计划KM200710005001;国家自然科学基金60372063;北京市自然科学基金4042009;北京市属高校人才强教计划

在线出版日期：2010-09-10（万方平台首次上网日期，不代表论文的发表时间）

页数：共6页

页码：1574-1579

英文信息展示

个人中心

我的学术圈

我的书案

退出

期刊专题

基于二维非负矩阵分解的1kb/s WI语音编码算法