改进YOLOv3的多模态融合行人检测算法

引用

摘要：

针对可见光单模态行人检测在夜间光线不足、目标密集、多尺度目标及目标部分遮挡场景中检测效果较低的问题,提出一种基于改进YOLOv3的多模态融合行人检测算法YOLOv3-Invo.该算法采用改进的Darknet-VI作为多模态特征提取网络模块,通过级联操作将两个不同特征图拼接输出,脖颈检测层分支引入空间金字塔池化模块并结合高效的内卷算子网络,以降低模型参数量;在检测网络层的深度卷积堆叠模块中设计新的ResFuse模型替换第一个卷积,并结合注意力机制CBAM模型,以加强融合特征图提取.对比实验表明,该算法在KAIST数据集上的行人检测准确率和召回率分别提升8.24％和2.82％,验证该算法的有效性,具有一定的研究价值.

关键词：行人检测、多模态融合、内卷算子、注意力机制

所属期刊栏目：48

分类号：TP391.4;TB9(计算技术、计算机技术)

资助基金：自治区自然科学基金;自治区重点实验室开放课题

在线出版日期：2022-06-13（万方平台首次上网日期，不代表论文的发表时间）

页数：共8页

页码：108-115

英文信息展示

个人中心

我的学术圈

我的书案

退出

期刊专题

改进YOLOv3的多模态融合行人检测算法