10.16451/j.cnki.issn1003-6059.202206008
面向视频中人体行为识别的复合型深度神经网络
在视频人体行为识别研究中三维卷积神经网络和双流卷积神经网络均存在不足.针对此种情况,文中提出结合双流网络架构和三维网络架构的复合型深度神经网络.在双流架构的时间流子网络和空间流子网络部分均采用改进的R(2+1)D卷积神经网络,分别从视频的RGB图像序列和光流图像序列中学习行为表示和分类方法,并融合时间流子网络、空间流子网络的分类结果.进一步地,在网络训练过程中,提出基于梯度中心化算法改进的带动量的随机梯度下降算法,在不改变网络结构的情况下提高网络的泛化性能.实验表明,文中网络在UCF101、HMDB51数据集上均获得较高的识别精度.
人体行为识别、双流卷积网络、三维卷积神经网络、梯度中心化
35
TP391.41(计算技术、计算机技术)
2022-07-14(万方平台首次上网日期,不代表论文的发表时间)
共9页
562-570