DOI：10.3969/j.issn.1673-5137.2023.04.008

基于端到端建模的低资源连续语音关键词识别系统

引用

摘要：

语音关键词识别具有广阔的市场应用需求.在嵌入式领域,由于嵌入式设备资源有限,应用场景复杂多变,对语音关键词识别系统提出了资源占用少,低功耗,响应快,系统鲁棒性好等更高要求.本文设计实现的低资源连续语音关键词识别系统基于端到端声学建模,采用知识蒸馏、模型量化、模型剪枝的方法将模型占用资源压缩到了36.8K字节,系统运行资源占用约133K字节.本文提出的连续语音关键词解码算法相比于传统的孤立词解码算法,噪声环境下的召回绝对提升6.88%.系统在主频120M,内存256K字节的BK3288低功耗SOC平台上进行20个关键词的识别测试,达到安静环境下召回率96.86%,噪声环境召回率74.81%,虚警0.2次/小时的识别性能.

关键词：低资源、语音关键词识别、模型压缩、令牌传递

分类号：TP391;TN912.34;TP273.4

在线出版日期：2023-08-29（万方平台首次上网日期，不代表论文的发表时间）

页数：共7页

页码：60-66

个人中心

我的学术圈

我的书案

退出

期刊专题

基于端到端建模的低资源连续语音关键词识别系统