期刊专题

基于2D-Haar声学特征的大规模说话人识别方法

引用
随着待识别人数的增加,文本无关的说话人识别准确率下降明显.针对这一问题提出了一种高准确率大规模说话人识别方法,该方法采用多个连续音频帧的声学帧特征构成声学特征图,进而获得高维度的2D-Haar声学特征,为训练出性能更优的分类器提供可能;再利用AdaBoost.MH算法筛选出具有较好区分度的2D-Haar声学特征组合进行分类器训练.实验结果表明,600人规模下的正确识别率为89.5%,100~600人规模下的平均准确率为91.3%.该方法适用于大规模说话人的识别,引入的2D-Haar声学特征有效,识别准确率高.此外,该方法还具有较低的算法复杂度和较高的时间效率.

说话人识别、2D-Haar声学特征、AdaBoost.MH

34

TP391(计算技术、计算机技术)

国家242计划基金资助项目2005C48;北京理工大学科技创新计划2011CX01015

2015-01-14(万方平台首次上网日期,不代表论文的发表时间)

1196-1201

相关文献
评论
暂无封面信息
查看本期封面目录

北京理工大学学报

1001-0645

11-2596/T

34

2014,34(11)

相关作者
相关机构

专业内容知识聚合服务平台

国家重点研发计划“现代服务业共性关键技术研发及应用示范”重点专项“4.8专业内容知识聚合服务技术研发与创新服务示范”

国家重点研发计划资助 课题编号:2019YFB1406304
National Key R&D Program of China Grant No. 2019YFB1406304

©天津万方数据有限公司 津ICP备20003920号-1

信息网络传播视听节目许可证 许可证号:0108284

网络出版服务许可证:(总)网出证(京)字096号

违法和不良信息举报电话:4000115888    举报邮箱:problem@wanfangdata.com.cn

举报专区:https://www.12377.cn/

客服邮箱:op@wanfangdata.com.cn

打开万方数据APP,体验更流畅