10.19665/j.issn1001-2400.2019.06.002
N-DenseNet的城市声音事件分类模型
针对城市声音事件分类领域中现有模型分类准确率不高 、泛化能力不强的问题,提出了一种N阶密集卷积神经网络的城市声音事件分类模型.首先,介绍了密集卷积神经网络的结构;其次,基于N阶马尔可夫模型将密集连接改进为N阶有关连接;然后,结合两者提出了一种更适合音频分类的模型 ——N阶密集卷积神经网络.该模型在避免梯度消失的前提下,有针对性 、规律性减少了特征图层之间的连接,更高效地融合了前N特征图层的信息,使得模型的收敛速度更快;最后,为了验证该模型,采用N阶密集卷积神经网络的一阶 、二阶子模型,基于UrbanSound8K和Dcase2016数据集开展了城市声音事件分类研究.研究结果表明,其模型准确率分别为83.63% 、81.03%,验证了该模型具有良好的分类准确率和泛化能力.
声音事件分类、密集卷积神经网络、N阶马尔可夫模型、N阶密集卷积神经网络
46
TP391.42(计算技术、计算机技术)
江苏省"六大人才高峰"计划ZBZZ-012;高等学校学科创新引智计划B18027;江苏省研究生创新计划KYCX18_0630,KY-CX18_1846;江南大学研究生科研与实践创新计划JNKY19_048,JNSJ19_005
2020-01-13(万方平台首次上网日期,不代表论文的发表时间)
共9页
9-16,94