基于改进YOLOv3的密集行人检测
行人检测是目标检测领域的一个重要分支,目前行人检测算法已经取得了较好的发展,但拥挤场景下存在着行人间的严重遮挡,这为检测任务带来了极大地挑战.为有效缓解该问题,在YOLOv3的基础上进行改进,提出单阶段密集行人检测算法:Crowd-YOLO,该算法将可见框标注信息加入到网络中,使网络同时预测全身框与可见框信息从而提升检测性能;提出时频域融合注意力模块(TFFAM),将频域通道注意力和空间注意力加入到网络中重新分配特征权重;采用数据关联型上采样代替传统的双线性插值,使深层特征图获取更为丰富的信息表达.使用非常具有挑战性的大型拥挤人群场景数据集CrowdHuman进行训练和测试,实验结果表明,所提方法比基础网络在AP50指标上提高了约3.7%,在召回率(Recall)指标上提高了3.4%,其中时频域融合注意力模块为网络带来了2.3%AP的性能增益.实验结果验证了所提方法在拥挤人群场景下的有效性.
行人检测;遮挡问题;YOLO;融合注意力;数据关联型上采样
44
TP391.41;TP332(计算技术、计算机技术)
上海市科委港澳台科技合作项目;中国博士后基金项目
2021-09-24(万方平台首次上网日期,不代表论文的发表时间)
共6页
90-95