计算机论文哪里有?本课题对水下鱼体的多目标跟踪进行研究,采取基于检测的多目标跟踪框架,从全监督和半监督两个角度实现了对水下鱼类实时跟踪的目的,解决了缺少水下鱼类跟踪数据集的问题。
1 绪论
1.2 国内外研究现状
随着计算机视觉技术的快速发展,很多学者都利用计算机视觉技术对鱼类进行研究,在水下鱼类检测和跟踪方面都取得了大量成果,为本课题提供了重要的研究基础。目标跟踪是计算机视觉领域的研究重点,目前的多目标跟踪算法大多基于TBD(Track by Detection)框架,这种框架基于目标检测实现跟踪。
1.2.1 鱼类目标检测现状
目标检测任务的目的是识别出图片中需要被检测的目标的类别,并使用一个外接矩形框标注目标的位置。早期的鱼类检测主要通过人工选择特征的方式实现。Cutter等人使用级联分类器对水下鱼类目标进行检测,分类器为勘探条件下的水下图像创建Haar-like特征,该算法在水下鱼类检测中取得了良好的效果(Cutter et al., 2015)。Ravanbakhsh等人提出了一种基于水平集框架的鱼类检测方法,通过主成分分析(Principal Component Analysis, PCA)对鱼的身体形状进行建模,再使用Haar分类器定位水下图像中的鱼头和鱼吻,实现了亚像素级的检测,克服了背景干扰、图像对比度差等问题(Ravanbakhsh et al., 2015)。Hsiao等人提出了一种基于稀疏表示分类的最大概率局部排序法,实现对鱼类的检测,使用多个包围盒来区分鱼类和其他物体,该算法达到了较好的准确率,但实时性不足(Hsiao et al., 2014)。由于以上这些传统方法需要手动选择合适的鱼类特征,鲁棒性较差,无法适应不同的水下环境,所以为提高算法的适应性和性能,有学者基于深度学习实现鱼类检测。
3 基于优化Yolov4-tiny检测器和Sort跟踪器的水下鱼体跟踪方案
3.1问题描述及整体算法框架
鱼类行为可作为水产养殖水质的重要指示性指标,其行为可以及时准确地反应水质的好坏。因此,对鱼类进行跟踪具有重要的意义,但当前存在的鱼类跟踪算法却存在诸多问题,首先,已有的鱼类多目标跟踪算法实时性不足,由于养殖渔场无法承担昂贵的硬件设备费用,为了使算法在硬件条件较差的条件下仍然可以实现实时跟踪,探究更快的鱼类多目标跟踪算法具有重要意义,其次,现有的Yolov4-tiny实时检测算法的精度不足,其网络只产生两个尺寸的输出,多尺度融合能力差,无法兼顾不同尺寸目标的检测,需要进行改进。最后,Sort算法被用来对MOTchallenge数据集中的行人目标进行跟踪,但水下鱼类的运动具有不同的特点,需要对Sort算法进行有针对性地改进。
4 基于半监督学习和注意力机制的少样本水下鱼体跟踪方案
4.1 问题描述及整体算法框架
在上一章节中本文使用了全监督的方式实现了水下鱼体目标的跟踪。在深度学习中,对模型的训练往往需要大量的有标签数据。全部采用有标签数据训练被称为全监督训练,目前鱼类跟踪领域的算法多为这种方式。但全监督训练需要制作包含大量标注样本的鱼类跟踪和检测数据集,这需要大量的人力成本。而在有标签数据较少的情况下,网络模型容易出现过拟合。为了在少样本情况下,实现水下鱼体目标的跟踪,本章对半监督的鱼体跟踪方案进行了研究。
在本章中本文提出了第二种水下鱼类跟踪方案,即基于半监督学习和注意力机制的少样本水下鱼体跟踪方法。首先,使用Yolov4-tiny作为本文的基础模型,并在其中加入了CBAM注意力机制,以增强模型的特征提取能力,本文将改进后的模型称为Yolov4-tinyCBAM。其次,使用Self-training半监督方法对模型进行训练。最后,将经过半监督方法训练后的Yolov4-tinyCBAM模型与第三章中的Simple-Sort算法结合,实现对水下鱼体的跟踪。
少样本水下鱼体跟踪方案的算法框架与第三章算法1的流程基本一致,本章接下来将对Yolov4-tiny的改进和半监督训练过程做出详细地介绍。
4.2 Yolov4-tinyCBAM算法
4.2.1注意力机制
注意力机制是对人类视觉系统的模拟,人类视觉系统不会对接收到的全局图像进行处理,而是会有针对性地对重要的局部信息投入更多的注意,以提高获取信息的效率。通过在神经网络中引入注意力机制,可以使网络对重要的局部信息投入更多的关注。在深度学习中,视觉注意力机制主要利用掩码(mask)来形成,通过添加一个额外的网络,选择输入的某些部分或者给输入赋予不同的权重。注意力机制分为硬注意力和软注意力(Sharma et al., 2015)。硬注意力更加关注于点,为输入项分配非0即1的权重,来确认输入中哪些需要被关注,哪些不应该被关注,由于强注意力是一个不可微的注意力,所以无法通过反向传播对权重进行学习。软注意力关注于区域和通道,是一种确定的注意力,被分配的权重是连续的,可以通过反向传播对权重进行学习,所以在神经网络中的应用更为广泛,通过在相关特征中学习到的权重,可以对输入特征进行优化。软注意力机制有着多种不同的使用方法,例如,有为特征图的不同空间分配不同权重的空间注意力机制,也有为特征图的不同通道分配不同权重的通道注意力机制。
Woo等人提出了CBAM模块(Woo et al., 2018),同时融合了空间注意力和通道注意力,能有效地提高网络模型的性能,其结构如图41所示。
5 总结与展望
5.2工作展望
未来本课题将会开展以下研究:
(1)部署在远程服务器上的算法,会因为网络延迟,使跟踪准确率降低,未来会将本课题的算法植入jetson和树莓派等硬件设备,同时对TensorRT技术进行学习,以加快网络的推理速度。
(2)本课题将制作黑夜环境下的水下鱼类跟踪数据集,并对跟踪算法进行优化,实现暗光环境下的水下鱼类跟踪。
参考文献(略)