计算机论文哪里有?本文利用真实数据集对所提出的方法进行了多方面的实验分析。在半监督场景下,本文使用五个来源于现实世界的数据集来评估IFC-GCN算法的有效性。
第一章 引言
1.2 国内外研究现状
1.2.1 图神经网络研究现状
图数据是由一系列的节点和边组成的离散网状数据结构,对图数据的研究起始于哥尼斯堡七桥问题[3],并由此奠定了数学界中图论和拓扑学的基础。在之后的研究中,学者深入研究由现实世界中的问题抽象得到的图数据,以便为实际问题提供解决思路。近年来,受深度学习在图像和文本等欧几里得结构数据上的成功应用启发,学者们将深度学习与图表示学习相结合进而提出了图神经网络(GNNs),图神经网络是一类基于深度学习思想来处理图数据的神经网络模型。受益于图神经网络强大的图表示学习能力,其已在推荐系统、链接预测和社区检测等领域取得显著成果。
一般来说,图神经网络可以被划分为基于空间的方法和基于谱的方法。基于空间的方法类似于传统的卷积神经网络(CNN),该类方法对每个节点选择一组固定数量的邻居节点,并对这组节点执行卷积操作。具体来说,Hamilton等人[2]提出GraphSAGE,GraphSAGE从邻居节点中随机采样并聚集采样到的邻居特征来更新中心节点表示。Veličković等人[4]提出图注意力网络(GAT),GAT引入多头自注意力机制来计算不同节点对的得分。Wang等人[5]提出一种可学习的位置注意力机制来解决交通流预测问题。不同于基于空间的方法,基于谱的方法直接在谱域中执行卷积操作。基于谱方法的流程是先通过傅里叶变换将数据从顶点域转换到谱域,在谱域中进行卷积操作,最后将卷积操作得到的结果通过傅里叶逆变换从谱域转换到顶点域。具体来说,Bruna等人[6]首次通过对图拉普拉斯矩阵进行特征分解来执行卷积操作。Defferrard等人[7]提出了切比雪夫网络(ChebyNet),ChebyNet通过对图拉普拉斯矩阵进行切比雪夫多项式分解,进而降低了模型的计算复杂度。更进一步,Kipf等人[1]提出了图卷积网络(GCN)。GCN是ChebyNet的简化版本,CGN只聚集一阶邻居节点的信息,在进一步降低模型计算复杂度的同时提高了模型性能。得益于GCN的高效性,后续有一系列工作围绕其展开[8,9,10]。
第三章 基于迭代特征聚类的社区检测算法
3.1 问题抽象
图神经网络是目前的研究热点之一,在处理图数据方面展现出了强大的性能。但是受限于图数据的复杂性和被标记数据的稀疏性,部分图神经网络无法充分利用原始训练数据从而影响算法在下游任务中的性能,尤其是社区检测这种贴近现实场景的任务。因此,如何缓解标签稀疏问题带来的负面影响是一项亟待解决的问题。为此,针对半监督场景下的社区检测,本章提出一种基于迭代特征聚类的图卷积网络模型(IFC-GCN)。本章的模型设计主要分为三个部分:用于识别节点对相似关系的无监督学习模块;用于修正节点向量表示的优化模型模块;用于修正伪标签的模型训练框架。最后,本章将从对比实验、消融实验和可视化实验等多方面对所提出算法的有效性进行验证。
对于图数据𝐺=(𝐴,𝑋),邻接矩阵𝐴∈𝑅𝑛×𝑛定义了图数据的拓扑关系,𝑋∈𝑅𝑛×𝑑定义了节点的初始特征矩阵。在半监督场景中,原始数据集只提供了少部分的带标签数据𝑌∈𝑅𝑛0×1,其中𝑛0表示带标签数据的数量。但是仍存在𝑛−𝑛0个节点,对于该部分节点,原始数据集只提供了它们对应的节点特征信息和拓扑信息,但缺失了对应的标签。本文将有标签数据和无标签数据分别归为集合𝐿0和𝑈0,其中有#𝐿0=𝑛0,#𝑈0=𝑛−𝑛0。本章的目标在于整合集合𝐿0和𝑈0来学习更好的节点向量表示,并将其应用于下游的社区检测。
第四章 基于多粒度特征交互的社区检测算法
4.1 问题抽象
在第三章中,本文提出了基于迭代特征聚类的图卷积网络模型来缓解社区检测在半监督场景下的标签稀疏性问题,并对比主流的社区检测算法取得了性能上的提升。但是仍需进一步考虑问题,面对未知的图数据,其可能不存在任何的标记数据。为此,许多工作将社区检测任务扩展到无监督场景[35]。在无监督场景下,由于数据本身并不存在任何标签,因此如何在充分学习数据自身信息的同时将算法的目标函数设计成以社区检测为导向显得尤为重要。为解决上述问题,本章提出一种基于多粒度特征交互的对比学习框架(CL-MGI),并将其与经典的图网络模型相结合。本章涉及的多粒度特征分别从节点级和图级两个视角来学习图数据集的细粒度和粗粒度信息。本章的模型设计主要分为五个部分:介绍基于重构的图网络模型;引入对比学习损失并论述其对社区检测的适用性;构建多粒度的对比学习模块;以协同训练的方式实现多粒度特征交互;对CL-MGI的时间和空间复杂度进行分析。最后,本章将从社区检测性能、参数敏感性分析以及消融实验等多方面对所提算法的有效性进行验证。
在无监督场景下,给定图数据𝐺=(𝐴,𝑋),社区检测旨在将𝑛个节点划分成𝑘个社区,使得同一个社区内部的节点尽可能相似,而不同社区之间的节点相似性差异变大。由于针对的是无监督场景,本章的目标是结合自监督学习的思想在邻接矩阵𝐴和节点特征矩阵𝑋中进一步挖掘有助于社区检测的信息。
4.2 模型设计与分析
4.2.1 基于重构的图网络模型
本章面向的是在无监督场景下的社区检测,由于缺乏图数据的标签,因此使用监督信号的损失函数无法直接适用于无监督场景的社区检测。为此,本节引入一种基于重构损失的图网络模型SDCN[63]作为主干网络来编码无标签的图数据。
受自动编码器(AE)[42]的影响,基于重构损失的图网络模型也以编码器-解码器的网络结构来处理图数据。其中编码器用于将非结构化的图数据抽象成低维的向量表示,解码器旨在将低纬的向量表示重构成原始的输入数据,通过衡量原始输入数据和解码器重构数据之间的差异来指导图网络模型的训练。具体来说,SDCN采用的编码器共包含两个部分,其一是利用传统的AE来重构输入的原始节点特征矩阵𝑋,另一个部分就是采用GCN中来编码图数据的拓扑信息和节点特征矩阵。
第五章 总结与展望
5.2 未来展望
本文所提出的IFC-GCN和CL-MGISDCN都在不同场景下的数据集上取得了最优的社区检测性能。但是这两个模型都存在可以改进的空间,未来还可以从以下三方面进行改进:
(1)IFC-GCN只用优化模型保留了节点对之间的相似关系,但实质上IFC模块也可以识别出需要扩大特征不相似的节点对。因此,在未来的工作中可以设计一种剪枝的方法先适当的缩小节点特征域的搜索空间,然后再利用优化模型来扩大节点对之间的不相似关系。
(2)IFC-GCN只优化了节点的特征向量,但是图拓扑信息作为图数据的重要组成部分,图拓扑信息也可能存在错误。因此,在未来的工作中可以利用IFC模块中的判别矩阵,识别出节点对之间的相似关系和不相似关系,然后通过删减边的方式修改节点对之间的邻接关系,从而纠正图拓扑信息中的错误信息。
(3)CL-MGI是一种框架结构但在本文中只与SDCN模型相结合。因此,未来的工作将探索CL-MGI与其它的图表示学习模型相结合。除此之外,CL-MGI引入的对比损失InfoNCE只能处理目标节点与单个正样本之间的关系。更进一步,可以考虑将其设计成能够处理目标节点与多个正样本的对比损失,并将新的对比损失应用于社区检测中。
参考文献(略)