基于改进YOLOv3的密集行人检测

引用

摘要：

行人检测是目标检测领域的一个重要分支,目前行人检测算法已经取得了较好的发展,但拥挤场景下存在着行人间的严重遮挡,这为检测任务带来了极大地挑战.为有效缓解该问题,在YOLOv3的基础上进行改进,提出单阶段密集行人检测算法:Crowd-YOLO,该算法将可见框标注信息加入到网络中,使网络同时预测全身框与可见框信息从而提升检测性能;提出时频域融合注意力模块(TFFAM),将频域通道注意力和空间注意力加入到网络中重新分配特征权重;采用数据关联型上采样代替传统的双线性插值,使深层特征图获取更为丰富的信息表达.使用非常具有挑战性的大型拥挤人群场景数据集CrowdHuman进行训练和测试,实验结果表明,所提方法比基础网络在AP50指标上提高了约3.7％,在召回率(Recall)指标上提高了3.4％,其中时频域融合注意力模块为网络带来了2.3％AP的性能增益.实验结果验证了所提方法在拥挤人群场景下的有效性.

关键词：行人检测;遮挡问题;YOLO;融合注意力;数据关联型上采样

所属期刊栏目：44

分类号：TP391.41;TP332(计算技术、计算机技术)

资助基金：上海市科委港澳台科技合作项目;中国博士后基金项目

在线出版日期：2021-09-24（万方平台首次上网日期，不代表论文的发表时间）

页数：共6页

页码：90-95

英文信息展示

个人中心

我的学术圈

我的书案

退出

期刊专题

基于改进YOLOv3的密集行人检测