上海论文网提供毕业论文和发表论文,专业服务20年。

基于深度学习的显著目标检测模型可扩展性探讨

  • 论文价格:150
  • 用途: 硕士毕业论文 Master Thesis
  • 作者:上海论文网
  • 点击次数:1
  • 论文字数:28555
  • 论文编号:
  • 日期:2023-01-05
  • 来源:上海论文网

计算机论文哪里有?本文提出通过最大差异竞争的模型诊断方法来审视SOD模型的泛化性,并指出了进一步推动SOD发展的途径。所提方法首先在一个新构建的独立于现有数据集的大规模测试数据集上比较现有的SOD模型,从数据集中挖掘出最具鉴别力的代表性样本集,以减小主观实验的标注成本。

1  绪论

1.2  国内外研究现状

在过去的几十年里,研究者们对显著目标检测进行了大量研究,研究主要分为自底向上的传统显著目标检测方法和自顶向下的深度显著目标检测方法。

1.2.1  传统显著目标检测方法

早期的显著目标检测模型[1-2]主要由先验知识驱动,关注启发式低级手工特征和显著性先验信息,如对比度先验[3-4]和背景先验[5]。Cheng等人[3]提出一种基于对比度的显著目标检测方法,该方法同时考虑了全局对比度和空间相关性。Zhou等人[4]利用紧凑性和局部对比特征来分割显著区域。Zhu等人[5]提出了一种结合图像分割和背景连通性评估的算法来分离显著目标。

以上这些方法利用图像的低级特征以自底向上的方式检测显著目标。在简单的场景中,低级特征在捕捉显著目标方面比较有效,但在内容多样化的场景中,先验信息往往会有所偏差,图像的预测结果容易受到影响。由于低级特征表征能力的局限性,研究者们逐渐将注意力转向自顶向下的深度显著目标检测方法。

1.2.2  深度显著目标检测方法

近年来,基于卷积神经网络(Convolutional Neural Network, CNN)的显著目标检测研究快速发展。研究者们提出了多种显著目标检测方法,其中包括多尺度特征融合方法、注意力感知方法、损失函数改进方法和轻量化参数方法。

(1)多尺度特征融合方法。早期基于CNN的显著目标检测模型[6-7]主要受池化操作的影响,容易丢失细节信息。基于网络深层特征提取高级语义信息,浅层特征获取低级细节信息的观察,研究者们提出了一些多尺度特征融合方法[8-13]来检测显著目标。Hou等人[9]在跨层连接的网络结构中引入短连接,将高级特征集成到低级特征中。Luo等人[10]提出一种网格卷积神经网络,该网络结合局部特征和通过融合深层特征与浅层特征得到的全局特征来预测显著目标。这两种方法只考虑了网络从深层到浅层的信息传递,而忽略了相反方向的信息传递。为了解决这个问题,Zhang等人[11]提出一种双向消息传递结构的模型,该模型考虑了低级特征和高级特征之间的双向交互。Wu等人[12]设计了级联部分解码器网络来预测图像中的显著目标。Liu等人[13]引入一个用于提取全局特征的全局引导模块和一个用于融合全局特征和细粒度特征的特征聚合模块来计算图像的显著性。

2  基于最大差异竞争的深度显著目标检测模型可扩展性研究

2.1  引言

显著目标检测旨在定位给定场景中引起人类视觉注意的区域,在分析人脑的活动中起着关键作用[1]。此外,显著目标检测还可作为许多其他计算机视觉任务的预处理步骤,例如目标跟踪[42]和语义分割[43]。与其他经典研究[44]类似,显著目标检测研究在深度学习技术发展的影响下取得了较好的进展。图2.1中展示了18个现有SOD模型在有效性和效率方面的直观比较,从图中可以清楚地观察到SOD模型的性能近年来一直在提升,一些模型[21,45]还在有效性和效率之间取得了很好的平衡。然而,图中的结果只能表示这些SOD模型对训练数据的拟合程度,并不能确保这些模型的性能可以推广到真实视觉世界中的其他未知场景。此外,关于深度神经网络鲁棒性的研究表明,深度神经网络容易受到对抗性干扰和破坏的影响[25,46]。因此,探讨SOD模型在真实视觉世界中的泛化能力具有重要意义。

计算机论文怎么写

注:图中的性能指的是最大F-measure(maximum F-measure,maxF[48])值,18个模型分别是:DSS[9]、NLDF[10]、ASNet[49]、ABDM[11]、PiCANet-R[14]、R3Net[50]、EGNet[19]、BASNet[20]、CPD-R[12]、PoolNet[13]、SCRN[24]、PAGENet[51]、F3Net[23]、GCPANet[17]、MINet[18]、RAS[22]、CSNet[45]和U2Net†[21]。

3  基于不确定性感知的显著目标检测方法

3.1  引言

显著目标检测旨在检测出给定图像中最具吸引力的目标。SOD作为预处理步骤,在图像质量评估[70]、图像检索[71]和视觉跟踪[72-73]等计算机视觉任务中发挥着重要作用。传统SOD方法[1,3,74-76]主要利用低级特征来预测显著目标,但由于缺乏高级特征提取,其表征能力相对有限,在复杂场景下的预测结果特别差。近年来,全卷积网络(Fully Convolutional Network,FCN)[77]突破了传统方法的瓶颈,极大地促进了SOD研究的发展。

基于FCN的SOD方法[9,78-79]表现出较强的特征表征能力并取得了显著进展,但“不确定性”问题仍然是SOD建模的一大障碍。大多数SOD模型能大致分离图像中的显著目标和背景,但在显著目标轮廓附近的区域预测效果不佳。因此,在显著目标轮廓附近总会出现一个微小的“模糊”环形,这意味着SOD模型为该区域的显著和非显著像素分配了相似的显著概率。为了解决这一问题,一些研究[13,19,24,61]引入轮廓图或细节图作为辅助监督信号来训练SOD模型,使预测的显著目标在视觉上更加“清晰”。通过观察现有SOD模型的预测结果,我们发现模型对目标内部轮廓(轮廓附近的显著像素)和目标外部轮廓(轮廓附近的非显著像素)进行分类比较困难。这些方法要么考虑显著目标的轮廓,要么考虑接近显著目标轮廓的显著像素,但都忽略了目标轮廓附近的非显著像素,且实验结果表明这些方法面对复杂场景时,在内部轮廓区域上的预测效果比外部轮廓区域上的更好。因此,我们认为忽略外部轮廓信息容易使模型错误预测轮廓附近的非显著像素。此外,轮廓信息和显著性信息的不充分利用也使得轮廓的预测变得困难。

3.2  显著目标检测模型

本节首先介绍了内部轮廓不确定性图、外部轮廓不确定性图和显著图之间的相互关系,然后详细描述了所提出的SOD模型,模型的框架如图3.2所示。

计算机论文参考

3.2.1  轮廓和显著性之间的相互关系

为了降低显著目标轮廓附近像素显著概率预测的不确定性,我们提出联合监督内部轮廓不确定性图、显著图和外部轮廓不确定性图三种标签来引导网络关注显著目标,并将部分注意力转移到显著目标轮廓附近的“不确定性”像素(即目标轮廓附近的显著像素和非显著像素)上。对于给定的图像,显著图标记图像中的显著目标,内部轮廓不确定性图强调目标轮廓附近的显著像素,而外部轮廓不确定性图则聚焦于目标轮廓附近的非显著像素。

4  总结与展望

4.2  展望

本文的研究主要涉及一种度量显著目标检测模型泛化性的方法和一种新的显著目标检测模型。虽然所提方法取得了一定的成果,但仍然存在一些不足之处,本文认为未来的研究还可以从以下几个方面展开:

(1)最大差异竞争方法的扩展研究。第一,扩展代表性样本集到更大的规模,并使用粗略标记显著目标的粗标签代替精确的像素级标签,以减小主观实验的标注成本。第二,在MAD竞争筛选得到的代表性样本集上迭代地微调SOD模型,以寻求性能更好的鲁棒模型。

(2)基于图像属性的研究。以本文研究中模型在具有不同属性的图像集上的性能为研究切入点,有针对性地解决模型在预测具有某些属性的图像的显著图方面比较薄弱的问题。

(3)基于数据集的研究。在建立新的显著目标检测数据集时,尽可能地收集不同类型的图像,考虑现实世界中各种有挑战性的场景。

(4)基于本文指出的改进方向研究。本文所提SOD模型考虑了多监督信号和特征交互策略,基于本文指出的改进方向,还可以以注意力提取、多尺度特征融合等方向为研究切入点改进模型性能,提升模型的泛化性。

参考文献(略)

123
限时特价,全文150.00元,获取完整文章,请点击立即购买,付款后系统自动下载

也可输入商品号自助下载

下载

微信支付

查看订单详情

输入商品号下载

1,点击按钮复制下方QQ号!!
2,打开QQ >> 添加好友/群
3,粘贴QQ,完成添加!!