计算机论文哪里有?本文针对非均匀强反光和模糊两种复杂下养殖鱼群检测问题,分别提出了基于 YOLOv5和 CVAE 的鱼群检测方法和融合 SKNet 与 YOLOv5 的鱼群检测方法。基于 YOLOv5 和CVAE 的非均匀强反光背景下鱼群检测算法首先利用 YOLOv5 对反光区域进行检测;
第 1 章 绪论
1.2 国内外研究现状
与传统方法相比,基于深度学习的目标检测算法更能适应真实养殖场景的需求,通过不断学习预测值与真实值之间的差异,得到有效解决方案,具有较强的适应性[16-17]。早期的目标检测方法采用两阶段检测,Girshick 等人[18-19]提出的 RCNN 和 Fast RCNN 在目标检测领域取得了较好的检测效果,但缺点是不能满足人们对实时性的要求。Ren 等人[20]在Fast RCNN 基础上提出了 Faster RCNN,解决了实时性这一问题,并提升了检测精度。为使 检 测 速 度 更 快 , 研 究 人 员 提 出 单 阶 段 检 测 算 法 , Joseph 等 人[21-23]先 后 提 出 了 YOLOv1-YOLOv3 单阶段目标检测算法,该算法在目标识别的基础上进一步进行定位,采取直接预测目标边界框和类别概率的方式对物体进行预测。在水产养殖领域,研究人员也采用基于卷积神经网络的算法对鱼群进行检测,Zhang D[24]提出来一种利用非最大抑制算法的鱼群检测方法,该方法构建的网络通过大量鱼类样本和不同水流速度导致的真假样本进行训练以实现鱼群检测。Xiu Li[25]提出了一种深度轻量级的卷积神经网络来检测鱼群,该网络利用改进了 ReL U,Inception 和 HyperNet 三个模块进行特征提取,使不同的语义信息和分辨率信息相融合以提升鱼群检测的精度。Jesper Haahr Christensen 等人[26]介绍了一种结合光学的鱼类检测网络,该网络通过水下拍摄图像的视觉信息进行鱼群识别和准确定位。上述基于卷积神经网络的方法在水产领域取得了较好的识别效果,但是由于特征提取网络层数较单一,造成不同尺度和多样性的鱼类检测效果较差。为解决该类问题,研究人员提出了基于 YOLO 系列算法的鱼群检测方法,Xu 等人[27]训练了一个 YOLO 架构,旨在用三个不同的数据集检测各种鱼类,实现了在水下视频中准确识别鱼群的目的。Liu 等人[28]结合 YOLOv3 和并行滤波器,开发一种新颖的水下鱼群检测与跟踪策略,在网箱鱼群的检测与跟踪方面,性能取得了一致性的提高。
第2章 相关理论介绍
2.1 深度学习
深度学习[49]是机器学习[50]和人工智能[51]的一个分支,如今被认为是当今第四次工业革命的核心技术。因深度学习对给定数据具有较强的学习能力,被研究人员认为是机器学习、人工智能以及数据科学和分析领域的热门话题之一[52]。包括谷歌、Microsoft、Nokia 等在内的许多公司都在积极研究它,因为它可以在不同的分类和回归问题以及数据集上提供显著的结果[53]。在工作领域,深度学可以被看作是一种模拟人类大脑处理数据的人工智能函数[54]。“深度学习”在全球范围内的流行度越来越大,与普通的机器学习相比,深度学习在效率方面不占优势。虽然深度学习参数众多,训练一个模型需要较长时间,但与其他机器学习算法相比,测试过程中运行时间较短[55]。 虽然第四次工业革命侧重于技术驱动的自动化、智能化和智能化系统,但源于人工神经网络的深度学习已经成为实现该目标的核心技术之一[56]。一个典型的神经网络主要由许多简单的、相互连接的处理元素或称为神经元的处理器组成,每个神经元都为目标结果产生一系列的实值激活。基于神经网络的深度学习技术目前被广泛应用于视觉识别、商业智能、网络安全等多个应用领域[57-58]。尤其是基于卷积神经网络的深度学习技术应用更加广泛,卷积神经网络直接通过输入数据进行学习,而不需要手工提取特征[59]。卷积神经网络主要由三部分构建块组成,分别是卷积层、池化层、和全连接层。
卷积层主要提取图像中的特征,由卷积操作和激活函数组成。卷积是一种特殊类型的线性操作,主要应用于特征提取任务中。在卷积神经网络中,输入端存在一个小数组的张量即卷积核,网络通过对卷积核的每个元素和输入图像的每个元素进行对应像素相乘得出逐个像素的乘积,再对每一组乘积进行相加求和得出输入张量的对应像素值,以上过程称为特征映射。
第4章 融合 SKNet 与 YOLOv5 的模糊背景下养殖鱼群检测
4.1 数据预处理及数据集的构建
4.1.1 基于 UNet 图像预处理
水下拍摄模糊的图像会导致某些鱼体轮廓不清晰,特征丢失或者不明显,阻碍后期目标检测网络对鱼类特征的提取,从而对水下群体目标识别的准确性产生影响,无法达到预期目标。为了准确检测水产养殖池塘中的鱼群,检测前需要对模糊图像进行预处理,即水下图像清晰化。根据本研究的特性,选取 UNet 作为清晰化网络用作水下鱼群图像预处理阶段,网络架构如图 4-1 所示。
4.2 融合 SKNet 的 YOLOv5 鱼群检测
通过图像预处理,得到了清晰的图像,为后续的鱼群检测提供了高质量数据。但是,由于本研究是针对视频影像的水产养殖企业的生产经营规划需求,不仅需要做到对视频流的实时识别,而且对检测的准确率和精确率也有极高的要求。因此,需要选择一种计算速度快和目标检测准确率高的网络框架作为基础的水下鱼群检测模型。YOLOv5 是目前检测准确率较高目标检测模型,并且单一图片的推理时间能够达到 7ms,即 140FPS,是目标检测领域处理速度最快的网络。因此,本研究选定综合性能较好的 YOLOv5 作为基础网络模型框架。
YOLOv5 有四个不同的模型,包括 YOLOv5s、YOLOv5m、YOLOv5l 和 YOLOv5x,四种模型主体结构相同,模型速度训练速度有所不同,对比如图 4-2 所示。YOLOv5s 网络是 YOLOv5 系列中深度和宽度最小的网络,YOLOv5m、YOLOv5l 和 YOLOv5x 都是在YOLOv5s 基础上加深和加宽的网络。当使用养殖鱼群数据集训练模型时,发现 YOLOv5x的结果比 YOLOv5s、YOLOv5m 和 YOLOv5l 好[31]。因此,本研究选择 YOLOv5x 以追求最佳检测性能,虽然 YOLOv5x 在目标检测领域获得较好的检测性能,但本研究用于训练模型的数据经过图像预处理后存在部分特征丢失或不明显问题。为了解决此问题,在YOLOv5 主干网络的末端融入 SKNet,即视觉注意力机制。YOLOv5 模型具有较好的适配性,在特征提取阶段为其融合 SKNet 构成复杂强大的特征提取网络,能有效提升 YOLOv5 的检测能力。
第 5 章 总结与展望
5.2 展望
本文所提两种算法针对非均匀强反光和模糊背景下的养殖鱼群检测效果取得了一致性的提高。但基于 YOLOv5 和 CVAE 的非均匀强反光背景下鱼群检测算法未考虑到模型参数和训练速度的问题,该算法在 YOLOv5 末端添加 Mask 机制为后续反光修复提供条件标签,再添加对抗学习网络提升修复后图像的质量,最后再一次利用 YOLOv5 对鱼群进行检测,以上一系列流程都使得网络参数增多,导致模型训练时间过长。融合 SKNet 与 YOLOv5的模糊背景下鱼群检测算法未考虑到鱼群重叠的情况,但鱼群较密集,重叠鱼群数量较多时,该网络的鱼群检测准确率会降低。因此,在未来工作中,针对以上两个问题,将进行以下改进:
1.改变网络模型的结构。考虑到基于 YOLOv5 和 CVAE 的非均匀强反光背景下鱼群检测模型所执行的任务较多,网络参数量较大,网训练时间较长。因此,采用模型轻量化算法对模型进行压缩和加速。通过模型压缩可以达到减少网络参数量的目的,通过加速可以达到降低计算复杂度和提升并行能力目的。在今后的研究工作中,该方法可以减少模型参数量和提升模型训练速度的同时,不降低模型的检测效果,具有更大的挑战性和实用性。
2. 建立新的特征提取网络模型。融合 SKNet 与 YOLOv5 的模糊背景下鱼群检测模型中使用基于 UNet 的网络结构提升鱼群图像的清晰度,UNet 在图像清晰化任务中表现的效果较好,该网络由编码器和解码器组合而成,结构较单一,只能完成图像清晰化处理。当鱼群较密集,重叠鱼群数量较多时,该网络的鱼群检测准确率会降低。因此,在 UNet 图像清晰化预处理阶段添加特征提取网络,使新提出的网络在图像预处理阶段不仅提升图像清晰度还能学习重叠鱼群的特征,提升密集鱼群检测的准确率,更加符合真实环境下的需要。
参考文献(略)