基于空间信息挖掘的复杂场景快速目标跟踪算法

刘加奇

南京理工大学

下载全文

在线阅读

引用

摘要：

视频目标跟踪是当前计算机视觉领域的主要研究方向之一，受到国内外科研人员的广泛关注。目标跟踪的基本任务是在给定第一帧目标信息的情况下，精确地预测出后续视频帧中目标的状态。经过几十年的研究，目标跟踪算法的整体性能已经非常优秀，但问题是算法复杂度也随之增加，这严重限制了其实际应用；同时，大部分跟踪算法更加关注目标区域信息而忽略了重要的背景信息，针对相似背景干扰、快速运动和遮挡等复杂场景，这些算法的性能还是很难令人满意。因此，如何提高目标跟踪算法在复杂场景下的跟踪性能，平衡算法在鲁棒性和实时性之间的矛盾，仍然是一个亟需解决的问题。　　本文以实现复杂场景下的快速目标跟踪为研究主线，针对如上问题，本文主要的研究工作概括如下：　　（1）提出高速空间约束项（HSC）：空间正则化判别相关滤波器（SRDCF）引入空间正则化权重来缓解边界效应问题，在解决相似背景干扰、快速运动等问题上表现出卓越的性能。然而，空间正则化的优化成本很高，这限制了其实时性能。针对这一问题，本文提出了高速空间约束判别相关滤波器（HSCDCF）。通过引入后验空间约束，以惩罚相关滤波器的系数，有效缓解了循环卷积造成的边界效应，并且简化了优化过程，使跟踪算法更加高效。在OTB-2013和OTB-2015两个基准上，与SRDCF相比，HSCDCF在精度和成功率两方面性能分别略微降低了2.7％和3.1%；速度方面，HSCDCF获得了62.5FPS的实时速度，比SRDCF快10倍，很好的实现了实时性和鲁棒性的平衡。　　（2）提出相似语义干扰物协助定位目标（DATracker）：目前大多数目标跟踪算法仅利用目标外观模型来定位目标，然而针对存在相似语义干扰物和快速外观变化的复杂场景时，这些算法往往会丢失目标。实验发现场景中的一些显著物体也能作为定位目标的锚点，基于此发现，本文提出了相似语义干扰物协助定位目标的跟踪算法。首先，同时检测目标和相似语义干扰物，利用卡尔曼运动模型簇来编码目标和干扰物之间的空间相对位置关系，以消除摄像机运动的影响，并在视频序列中传递这些重要的时空信息。检测阶段，利用预测的目标相对位置信息与所有候选目标相匹配，匹配度最高的即为目标。所提出的模型简单、高效，具有很强的适用性。在LaSOT基准数据集上，对比于基础算法，本文算法获得了1.2%成功率的提升，验证了其有效性。　　综上，本文通过充分挖掘场景中的空间信息，有效地解决了相似背景干扰、快速运动和遮挡等复杂场景问题，同时本文提出的算法都保持了实时速度，能很好地实现算法在实时性和鲁棒性之间的平衡。

关键词：目标跟踪;复杂场景;空间信息挖掘;相似语义干扰物;卡尔曼滤波

授予单位：南京理工大学

授予学位：硕士

学科专业：物理电子学

导师姓名：柏连发

学位年度：2022

语种：中文

分类号：TP391.41

在线出版日期：2023-08-22（万方平台首次上网日期，不代表论文的发表时间）

个人中心

我的学术圈

我的书案

退出

学位专题

基于空间信息挖掘的复杂场景快速目标跟踪算法