10.3969/j.issn.2095-2163.2024.01.014
基于视频预训练和注意力特征融合的行人重识别方法
行人重识别是跨摄像头追踪的关键环节之一,主流方法多采用ImageNet进行预训练,忽视了数据集的域间差异,且以结构庞大的多分支模型居多,模型复杂度较高.本文设计一种行人重识别方法,采用基于原始视频带噪声标签参与监督的方式进行预训练,减少域间差异以提升特征表达能力;以基于注意力的特征融合方式取代残差网络的跳接映射,增强网络的特征提取能力;在网络中嵌入坐标注意力机制,在低复杂度的情况下强化关键特征,抑制低贡献特征;采用随机擦除对输入数据做数据增强以提高泛化能力,联合分类损失、三元组损失和中心损失函数对网络进行监督训练.在公开数据集Market-1501和Duke-MTMC上完成了消融实验,与主流方法对比实验表明本方法在不需要复杂多分支逻辑结构的前提下,仍可达到较高的精度.
行人重识别、预训练、残差网络、特征融合、注意力机制
14
TP391.41(计算技术、计算机技术)
福建省自然科学基金项目;福建省自然科学基金项目;福州市科技计划项目;福州市科技计划项目
2024-01-31(万方平台首次上网日期,不代表论文的发表时间)
共7页
95-101