10.3969/j.issn.1000-386x.2015.04.032
基于自适应阈值与基频检测的自发性口语音频分割算法
为了去除自发性口语音频中静音和噪音段的干扰,提高语音识别率和解码识别效率,提出一种音频能量自适应阈值计算方法。针对实时自动口语评测应用,设计了能量阈值自适应系数,该方法将根据能量阈值自适应系数动态地给每个考生的个人单次所有考试音频计算匹配一个能量阈值,以避免阈值选择和硬门限判决造成的误检。在基于自适应能量阀值的音频切分后,加入了基频检测步骤,以判别切分后所得音频段是否为噪声,从而最终分离出纯净的口语音频部分。实验结果表明,该算法能有效准确地切分音频,且鲁棒性较强。
自发性口语评测、自适应性、音频切分、基频检测
TP391(计算技术、计算机技术)
贵州省科技厅、贵州民族学院科技联合基金黔科合J 字 LKM[2011]10号;贵州省科技厅项目黔科合字[2009]2126号
2015-04-27(万方平台首次上网日期,不代表论文的发表时间)
共5页
133-136,159