学位专题

目录>
<

基于深度神经网络的大规模人群密度估计算法研究

易虎
华东交通大学
引用
大规模人群聚集的场景给公共安全带来较多的隐患。准确地计算出密集场景中的人数,并直观地呈现人群的空间分布状况,为有关部门提供实时预警,可以有效防止异常事件的发生,对安全监测、交通控制和城市安全至关重要。近年来,深度学习技术在人群计数中的应用显著提高了模型的性能,但仍面临许多挑战,包括图像与背景之间人群分布的多样性、尺度的剧烈变化、遮挡严重等。为了解决这些问题,本文在以往人群计数的研究基础上,对浅层特征的提取、特征融合以及精细密度图的生成等方面展开进一步的研究,结合深度卷积网络、空间金字塔池化,以及注意力机制构建深度神经网络模型,用于理解高度拥挤的大规模人群场景并进行精确计数,生成精细化的人群密度图。本文的主要工作和创新点可归纳如下:  (1)基于空间上下文特征融合网络的人群密度估计算法。为了在每个人群图像的位置上利用正确的上下文,并考虑到人群注意力信息,以更准确地预测像素级别的密度图。该算法首先选取不包括全连接层的VGG-16网络的前十个卷积层对输入图像的低层特征进行提取;然后利用不同尺度的丰富卷积计算具有尺度感知的特征,并自适应编码精确估计密度图所需上下文信息的尺度;之后通过通道空间注意力感知模块对融合的特征图进行校准和再融合,以忽略掉一些背景细节,将模型的关注点集中在行人的头部区域;最后通过空洞卷积网络进行最终的人群密度估计。在多个公开的人群计数数据集上进行的对比实验表明该算法能够在提高特征融合有效性的同时,准确预测人群密度。  (2)对初步实现的基于空间上下文特征融合网络的人群密度估计算法(记为:初始模型)进行优化,提出一种基于改进的多尺度上下文特征融合网络的人群密度估计算法。为了增强模型对人群图像尺度剧烈变化的适应能力,同时克服性能和复杂度之间的矛盾。该算法不再通过学习预测权重图在每个空间位置上设置每个尺度感知功能的相对影响,而是将浅层特征分组为大小不同的四个并行块,以提取不同尺度的上下文特征信息,并将通道依赖性和空间依赖性注入特征图中,从而使模型能够在抑制无关背景的同时,聚焦于有用的特征。在多个大规模且具有挑战性的人群计数数据集上的大量实验表明所提算法优于许多最近最先进的方法。此外,相比初始模型,该算法在鲁棒性、准确性和泛化性方面不仅能够保持原有的性能,而且具有更低的时间复杂度和空间复杂度。

人群密度估计;人群计数;上下文特征融合;尺度感知;注意力感知

华东交通大学

硕士

计算机技术

熊李艳

2023

中文

TP181;TP391.41

2023-11-30(万方平台首次上网日期,不代表论文的发表时间)

相关文献
评论
相关作者
相关机构
打开万方数据APP,体验更流畅