基于孪生网络的目标跟踪技术思考与实现

论文价格：150
用途：硕士毕业论文 Master Thesis
作者：上海论文网
点击次数：1
论文字数：44585
论文编号：
日期：2023-04-11
来源：上海论文网

TAGS:

计算机论文哪里有？本文从如何在复杂环境中进行稳定准确的目标跟踪出发，对基于孪生网络的目标跟踪技术展开深入研究。

第一章绪论

1.2 国内外研究现状

根据目标跟踪算法的发展阶段，本节将分别从传统的目标跟踪算法、基于相关滤波的目标跟踪算法和基于深度学习的目标跟踪算法三个阶段，对目标跟踪的研究现状进行分析与总结。

1.2.1 传统的目标跟踪算法

目标跟踪算法按照其工作原理可以分为生成式模型和判别式模型两种。早期的目标跟踪算法一般可以归结为传统目标跟踪算法，主要集中于生成式模型的研究，如光流法、卡尔曼滤波（Kalman Filter）和均值漂移（Meanshift）等算法；后来判别式跟踪算法也随之出现，如TLD和Struck算法。

1.2.1.1 生成式模型

生成式模型旨在提取运动目标的外观特征，对目标状态建模，然后在后续帧中搜寻与目标模板最相似的区域，作为最佳的预测目标位置。生成式模型可以获取到较多的运动目标信息，使跟踪器在实时性与准确度上往往有着较好的表现。但另一方面，通过单一的数字模型描述待跟踪目标存在一定的局限性，容易使模型在处理相似背景、运动模糊等复杂问题时受到干扰而影响性能。

LK光流算法[17] 于1981年由Lucas-Kanade提出，该算法利用视频序列在相邻帧之间的像素关系来分析确定目标的运动情况。当图像帧中存在运动目标时，背景和运动物体形成的光流矢量存在差异，通过分析相关像素点的位移和速度矢量特征的变化，从而实现对运动目标的跟踪。虽然光流包含了目标的运动信息和背景的三维信息，可以较好地表达图像的变化，但是此类算法计算量大，且需满足画面亮度恒定、时间连续和空间一致性。因此，在真实场景中的实时性和实用性并不高，在目标运动速度缓慢和背景静止的情况下才有较好的跟踪表现。随后，学者们基于此算法进行了许多改进[18] [19] [20] ，使算法的处理速度和鲁棒性有了部分提升。

第三章融合注意力机制的孪生网络目标跟踪算法

3.1 算法概述

经过多年的发展，基于孪生网络的目标跟踪算法不断进步，因其良好的跟踪精度和效率受到了极高关注，已成为目标跟踪算法的重要分支。在利用孪生网络进行目标跟踪时，需要提取目标模板和待搜索区域图像的特征并对其进行相似度计算，以判断当前搜索区域与待跟踪目标的外观是否匹配，从而实现对目标位置的预测。其中，相似度计算的准确与否至关重要，直接影响着跟踪算法对目标状态的判断。当跟踪场景中出现遮挡、运动模糊等复杂情况时，待搜索区域内提取到的信息也受到相应干扰，使相似度计算不准确，从而影响跟踪效果。因此，为了降低复杂环境中其他干扰因素对相似度计算的影响，使相似度计算更加准确，提高跟踪算法的精度与鲁棒性，本文提出了融合注意力机制的孪生网络目标跟踪算法。

首先，算法采用孪生网络架构，提高对特征的判别能力，解除其平移不变性的限制，通过深度神经网络提取包含丰富信息的多层次特征；然后，引入注意力机制，构建了交叉相关模块DCAM，使得相似度在计算时能尽量避免复杂情况带来的干扰，更加关注对跟踪结果有利的信息，进行稳定可靠的目标跟踪；最后，设计了一种高效的自适应响应图融合策略，提升了响应图质量，使目标定位和边界框尺度更加准确，实现精确持续的目标跟踪。本章算法的基本框架由一个用于特征提取的孪生网络和用于分类、回归的两个子网络构成，算法框架的详细说明将于第四节中进行阐述。其中，分类与回归分支共同完成相似度的计算，实现对目标位置的预测。

第五章原型系统与实验验证

5.1 原型系统的设计与实现

在本节中，我们有效整合了本文提出的融合注意力机制的孪生网络目标跟踪算法和基于孪生网络的无锚框视觉目标跟踪算法，设计并实现了一个原型系统，如图5.1所示。该原型系统在Linux环境下，基于Pytorch框架，使用Python语言实现，主要由四大模块组成：多种不同的跟踪场景、数据的预处理与特征提取、响应生成与位置预测，以及实验验证。其中，数据的预处理与特征提取、响应生成与位置预测两大模块是核心内容。

多种不同的跟踪场景中采集到的视频序列，为原型系统提供待跟踪的视频数据。当前，目标跟踪作为计算机视觉领域的基础研究内容之一，在各行各业中被广泛应用，如智能交通系统、场所视频监控、动物行为监测、灾后搜寻救援等。

数据的预处理与特征提取模块的功能通过两部分实现，一是视频序列的预处理，二是孪生卷积神经网络。当接收到待跟踪的视频序列时，首先，根据初始帧中提供的待跟踪目标信息，获取待跟踪目标的尺寸s与中心位置坐标p，初始帧中的目标信息一般由人工标注或目标检测算法得出。然后，根据尺寸s计算出目标模板与搜索区域的裁剪尺寸，在初始帧中裁剪出原始的模板区域图像，并在后续帧的位置坐标p附近裁剪出搜索区域图像。最后，对裁剪出的图像进行填充、缩放等处理，输出模板区域z和搜索区域x。

5.2 实验设计

5.2.1 环境配置及实施细节

本文研究内容的实验环境如表5.1所示，主干网络为调优后的ResNet-50，采用在ImageNet[90] 上预训练过的权值进行初始化，冻结前两层的网络参数，衰减权重和动量设为0.0001和0.9。进行网络训练时，训练数据以图片对的方式输入孪生卷积神经网络，模板分支和搜索分支接收的图片大小分别为127*127、255*255。

在实施细节上，融合注意力机制的孪生网络目标跟踪算法中，采用随机梯度下降法（Stochastic Gradient Descent，SGD）训练网络，batch size设为28，训练周期为20个epoch。前5个epoch学习率从0.001增加至0.005为预热阶段，随后15个epoch学习率从0.005逐渐衰减到0.00005。前10个epoch冻结主干网络权值，后10个epoch中，以当前学习率的十分之一对主干网络进行微调。本算法总体网络框架的训练过程如3.4节所述。

第六章总结与展望

6.2 展望

本文的研究内容围绕着如何在复杂环境下更好地执行目标跟踪任务展开，相继完成了融合注意力机制的孪生网络目标跟踪算法和基于孪生网络的无锚框视觉目标跟踪算法的研究，并且设计了大量实验对算法效果进行了验证。然而，基于孪生网络的目标跟踪技术研究仍然在不断发展，新的思路和方法层出不穷，本文仅取得了一些初步的研究成果，未来仍需要在以下两个方面继续开展研究和完善工作：

（1）建立目标外观更新模型。跟踪过程中，当目标发生遮挡、形变或因光照变化对目标外观产生影响时，如何对目标模板进行调整与更新，使得算法能够及时捕捉到目标最新的状态信息，从而进行更好的目标跟踪，是下一阶段的重要工作。

（2）完善算法的实用化研究。下一步拟将跟踪算法搭载到无人机上，首先，在无人机航拍数据集上进行测试与算法调优；然后，基于ROS系统，设计目标跟踪模块，与环境感知、运动规划和飞行控制等模块相结合；最后，实现无人机在未知环境下的自主跟踪飞行。

参考文献（略）

写作参考：计算机论文选题怎么选[独家解析]

123

限时特价，全文150.00元，获取完整文章，请点击立即购买，付款后系统自动下载

立即购买

也可输入商品号自助下载

下载

微信支付

查看订单详情

输入商品号下载

基于深度学习的视觉SLAM算法探讨

没有了

返回→计算机论文

论文写作模板

计算机论文范文样本

基于孪生网络的目标跟踪技术思考与实现

计算机论文

论文写作模板

计算机论文范文样本

计算机论文写作模板