上海论文网提供毕业论文和发表论文,专业服务20年。

基于深度表示学习的多视图聚类方法探讨

  • 论文价格:150
  • 用途: 硕士毕业论文 Master Thesis
  • 作者:上海论文网
  • 点击次数:1
  • 论文字数:42522
  • 论文编号:
  • 日期:2024-08-06
  • 来源:上海论文网

计算机论文哪里有?本文提出了全局跨视图特征聚合的多视图聚类、锚点共享和簇对比学习的多视图表示学习算法以及多分支空间共享的多视图一致性表示学习算法以解决当前多视图聚类方法存在的一些关键问题。

1绪论

1.2研究现状

1.2.1传统的多视图聚类方法

近年来,多视图聚类问题引起了研究人员的广泛关注。目前针对多视图聚类的方法主要分为三类:(1)基于矩阵分解的多视图聚类[11,12],它们通过非负矩阵分解挖掘多视角数据的共识表示,Wang等人[11]通过伪标签引导的矩阵分解实现联合学习潜在表示和聚类结构,并根据数据分布自适应地学习每个视图的权重。(2)基于子空间的多视图聚类[13–18],它们从每个视图中学习一个共识的子空间自表示矩阵,并通过在共识自表示矩阵上应用不同的正则化项将数据点划分到不同的子空间中。为了降低算法复杂度,Kang等人[15]根据样本和锚点之间的二部图计算相似图或自表示,这些方法直接在原始特征空间中学习图或自表示,样本的冗余信息和噪声特征不可避免地混合在一起。(3)基于图学习的多视图聚类[19–25],它们通常做以下步骤:首先构建特定视图,然后从多个特定视图中通过不同的正则化项获得融合图,最后通过谱聚类或图切割方法或其他算法产生聚类结果。Sun等人[17],通过将锚点学习和图构建融合到统一的框架中,实现了更精准的数据表示学习和高效的大规模数据聚类。

这些传统的多视图聚类方法大多在原始特征空间进行矩阵分解或图学习,然而原始特征空间上有噪声不利于聚类。还有少部分方法采用核空间转化的方法,他们假设原始特征空间能够被映射到一个或几个核空间,然而这不足够表达复杂的数据特征。尤其是在处理高维或大规模数据时,这些方法面临着挑战,因为它们可能会受限于计算的复杂度和内存的不足。

计算机论文怎么写

3全局跨视图特征聚合的多视图聚类算法

3.1引言

多视图聚类通过无监督的方式学习共识表示,将数据样本划分到它们各自的类别中。由于深度神经网络在许多视觉任务中表现出色,深度聚类方法也引起了研究人员的更多关注。尽管当前基于深度学习的多视图聚类方法在多视图聚类任务中取得了显著的进展,但仍然存在以下问题,问题一:目前几乎所有的基于深度学习的多视图聚类方法[32,35,56]都采用视图的融合方法,对所有视图进行加权求和或级联。然而,这种方法存在一个问题,很难从多个视图中获得具有区分性的一致表示,这是因为某些样本的一个视图或几个视图中可能包含过多的噪音,或者在收集过程中可能遗漏了一些信息;问题二:为了对齐不同视图的表示,当前的方法采用了对比学习的方法,而它们采用的是样本级别的对比学习方法[35,37],通常将来自同一样本的视图表示作为正对,将来自不同样本的视图表示作为负对(包括来自同一簇不同样本的视图表示)。然而,这可能与聚类目标相冲突,因为来自同一簇的样本的表示应该是相似的。为了解决上述问题,本章提出了一种新颖的全局跨视图特征聚合的多视图聚类算法。首先学习视图的潜在表示并利用自编码器重建原始数据。然后,设计了一个全局跨视图特征聚合模块,它能够学习样本之间的全局结构关系,并根据所有样本的全局相似关系来获取一致性视图表示。此外,利用学到的全局结构关系和一致性视图表示来通过对比学习建立与视图特定表示的一致性,从而最小化低结构关系的表示之间的相似性。

5多分支空间共享的多视图一致性表示学习算法

5.1引言

多视图聚类利用来自不同视图或模态的信息融合,提供更全面、准确的数据描述,从而能够提高聚类的准确性。多视图聚类在医学影像分析、生物信息学、推荐系统等领域有着广泛的应用。尽管以往的多视图聚类方法已经取得了显著的效果,但是目前仍然存在以下的一些问题,问题一:当前的跨样本的融合方法,仅考虑同一批次数据内的相关性进行局部样本级的融合(如基于Transfomer的融合方法[81]),这难以获得一致性判别表示;问题二:许多深度多视图聚类方法只考虑了特征表示的对齐,而忽略了隐藏的语义标签信息;问题三:许多方法采用“两步聚类”方法,将聚类过程与数据表示学习分开。尽管在某些情况下这种方法可能具有灵活性和性能提升,但也存在信息丢失、复杂度增加和难以优化等问题。为了解决这些问题,在本章中我们设计了一种新颖的用于多视图聚类的多分支空间共享网络来解决上述问题。具体的,我们提出了一个多分支空间共享模块,以过滤掉视图特定信息,并通过学习不同批次样本的共享样本表示空间来避免局部样本级融合。此外,我们还设计了一个双重跨视图对比学习模块,通过将学习到的统一判别表示映射到实例特征空间和语义空间,来对齐不同视图的特征表示并捕获语义信息的一致性。

5.2多分支空间共享的多视图一致性表示学习算法

图5.1展示了多分支空间共享的多视图一致性表示学习算法(MS2Net)的整体网络框架。MS2Net的整体框架包括两个模块:多分支空间共享特征聚合模块(MS2FA)和双重跨视图对比学习(DCCL)。具体来说,MS2FA专注于学习不同批次输入的共享样本表示空间,将每个样本的表示投影到低维共享空间中,并获得每个样本的权重,最后,根据获得的权重重构样本的表示。DCCL将学习到的统一表示分别引入到实例级特征对比学习(IFCL)和类别级语义标签对比学习(CSCL)中,通过从不同角度对齐特征表示并捕获语义信息的一致性,DCCL进一步增强了我们端到端聚类的可分性和紧凑性。本章引入了一个多视图数据集{Xv∈RN×dv}Vv=1包括N个样本V个视图,这些样本在V个视图中分别有dv维的特征,多视图聚类的目标是将N个样本划分到K个簇中。在下面的的章节中将会详细的介绍所提出的每个模块。

计算机论文参考

6总结与展望

随着信息化的快速发展,数据通常由各种社交媒体或视角收集。多视图聚类通过整合来自不同源的数据视图,提高了数据分析的全面性和准确性,对处理复杂多源数据具有关键意义。由于深度神经网络可以通过多层非线性变换和特征提取将原始数据转化为更抽象和有意义的表示,从而更好地捕捉数据的底层结构。受深度学习的启发,本文提出了全局跨视图特征聚合的多视图聚类、锚点共享和簇对比学习的多视图表示学习算法以及多分支空间共享的多视图一致性表示学习算法以解决当前多视图聚类方法存在的一些关键问题。本文的具体研究内容如下:

研究一:全局跨视图特征聚合的多视图聚类算法,该方法首先通过利用自编码器模型学习视图特定的特征来重构原始数据。然后,我们设计了一个GCFAgg模块,它可以学习样本之间的全局相似性关系,来增强所有样本的表示共识表示,使得具有高度结构关系的这些样本的表示更加相似。此外,我们设计了SgCL模块,解决了以前对比学习方法中同一聚类中不同样本的表示不一致的问题。大量的实验结果表明,我们的方法在完整和不完整的多视图聚类任务中具有最先进的性能。

研究二:锚点共享和簇对比学习的多视图表示学习算法,该方法将视图特定学习和视图共同学习分为不同的网络分支,从而解决了使用相同表示进行重构目标和一致性目标之间的冲突。其次,提出的ASFA模块通过从不同批次的数据样本中学习共享的锚点并建立锚点与样本之间的二部图关系来改善样本的表示。此外,CwCL模块将从共识表示中学到的样本之间的转移概率结合到对比学习中,以确保我们只最小化那些具有低转移概率的负样本对之间的相似性。它有效的缓解了以前样本级对比学习中的对齐冲突。实验比较表明,ACCMVC实现了最先进的性能。

参考文献(略)

123
限时特价,全文150.00元,获取完整文章,请点击立即购买,付款后系统自动下载

也可输入商品号自助下载

下载

微信支付

查看订单详情

输入商品号下载

1,点击按钮复制下方QQ号!!
2,打开QQ >> 添加好友/群
3,粘贴QQ,完成添加!!