10.19665/j.issn1001-2400.2021.05.009
一种复杂监控场景下的人体检测算法
在工业视频监控场景中,由于复杂背景、人体多姿态和人体遮挡等因素的影响,现有人体检测算法存在着准确率不高、模型泛化能力不强等显著问题.针对以上问题,基于特征图像金字塔和多尺度感受野理论,设计了一种检测网络的特征融合方式和特征图的生成策略,依靠轻量级的特征图像金字塔技术,并结合数据增强、锚点框匹配策略和遮挡损失函数等优化方法,进而提出了一种基于深度神经网络的人体检测算法EFIPNet.同时,为了充分验证EFIPNet算法的有效性,共建立了4个多元化的复杂监控场景下的人体数据集,其中涉及50种常见的人体行为.算法的有效性验证表明,新设计的高效人体检测算法可以有效地提高人体目标的检测精度,实现复杂监控场景下的人体精确和实时检测.此外,为了验证EFIPNet算法中不同模块的有效性,采用消融研究方法分析了网络中主要模块对人体检测模型性能的影响.在Person数据集上,EFIPNet算法在保持45帧/s检测速度的同时,相比于单发多盒检测器检测算法,将人体目标的检测精度提升了4.34%.
深度神经网络;视频监控;特征融合;特征图生成策略;人体检测
48
TP18(自动化基础理论)
国家自然科学基金61573013
2021-11-18(万方平台首次上网日期,不代表论文的发表时间)
共10页
68-77