基于头肩卷积特征的人体目标检测方法研究及应用

徐雨亭

电子科技大学

下载全文

在线阅读

引用

摘要：

人体目标检测技术是近几年来计算机视觉领域的研究热点。它在自动驾驶技术、智能视频监控以及智能人机交互系统等领域具有广泛的应用前景。另一方面，人体目标检测是一项基础性的研究工作，它为后续的行人跟踪、行人重识别和行人的行为分析奠定了基础，行人检测结果的优劣直接影响着后续视觉任务的开展。随着Faster RCNN、SSD、YOLO等深度学习的方法在PASCAL VOC、COCO Detection等公开测试平台上取得了引人注目的好成绩，将这些优秀的算法迁移到人体目标检测中成为了一种趋势。然而检测人体目标相较于普通的目标对象具有以下几个挑战：（1）行人姿态千差万别，很难学习到一种统一的特征描述方式；（2）同一张图像中行人的尺度变化比较明显，需要特征描述子能适应尺度的变化；（3）密集人群中容易出现行人间的相互遮挡。　　通过对以上问题的深入分析，本文在区域全卷积神经网络（R-FCN）的基础上提出了一种基于头肩卷积特征的人体目标检测方法。该方法的主要研究内容包含以下三个方面的贡献：　　（1）针对行人姿态的变化，本文采用人体头肩Ω模型作为视频监控场景中人体目标的表征模型。相较于学术界广泛采用的人体全身模型，人体头肩Ω模型对姿态变化具有更好的鲁棒性，同时采用人体头肩Ω模型可以一定程度地减少人体目标被遮挡的概率。　　（2）针对目标尺度的变化，本文采用R-FCN中位置敏感池化的方式和金字塔特征结构，并用两条路径对大尺度和小尺度的人体目标分流检测，这样在引入非常微小的计算开销的同时使网络能适应目标尺度的变化。　　（3）对于行人遮挡问题，本文提出两点改进。第一点，本文提出一种具有放回采样策略的非极大值抑制算法的改进，通过引入一种边框相似度量来处理行人相邻遮挡的情况；第二点，本文从改变遮挡样本数据分布的角度出发，通过生成对抗网络ASDN生成多种遮挡的样本来提高网络对于行人部分遮挡情况的适应性。　　本文使用该方法与基于深度学习的代表性目标检测算法Faster RCNN、R-FCN分别在三个数据集上进行了对比实验，本文提出的算法在Caltech、DukeMTMC和Bronze这三个数据集上分别取得了95.35%（提高了1.92%）、96.27%（提高了1.07%）和97.43%的准确率（提高了3.42%），验证了本文所提出的方法在实际监控场景中的有效性。

关键词：人体目标检测;头肩卷积特征;姿态变化;尺度变化;遮挡处理

授予单位：电子科技大学

授予学位：硕士

学科专业：控制科学与工程

导师姓名：徐红兵

学位年度：2019

语种：中文

分类号：TP391.41

在线出版日期：2019-09-16（万方平台首次上网日期，不代表论文的发表时间）

个人中心

我的学术圈

我的书案

退出

学位专题

基于头肩卷积特征的人体目标检测方法研究及应用