第一代图卷积网络:图的频域网络与深度局部连接网络

简介: 第一代图卷积网络:图的频域网络与深度局部连接网络

论文标题:Spectral Networks and Locally Connected Networks on Graphs


论文链接:https://arxiv.org/abs/1312.6203


论文来源:NeurIPS 2014


本文需要的前置知识:傅里叶变换与谱图理论基础


链接:


傅里叶级数与傅里叶变换


图神经网络中的谱图理论基础


一、概述


CNN在机器学习领域内的一些问题上取得了比较成功的效果,这主要得益于它处理的底层数据通常有一个坐标网格结构(在1,2,3维度上),因此这些数据就存在平移不变性( translational equivariance/invariance)。图像、语音、视频就属于这一类数据。由于网络不具备平移不变性(网络中的每个节点的邻居数量是不固定的),因此在网络上直接应用CNN是比较困难的。


对于常规的网格数据,CNN能够利用以下几个很好地结合在一起的结构来大大减少系统中的参数数量:


①平移结构(translation structure),使用滤波器在数据的网格结构上平移处理数据,从而实现参数共享,并没有使用线性映射;


②网格上的度量,使用紧凑支持滤波器(compactly supported filters),紧凑支持滤波器是指与输入数据大小无关的滤波器,它的大小可能远小于输入数据的大小;


③网格的多尺度二元聚类(multiscale dyadic clustering),是指CNN应用了跨步卷积(stride convolution)和池化(pooling)来进行下采样(subsampling)。


N%HB5AOGB]C`6I2RPJQ`SH8.png


然而某些数据并不具备上述几何结构,比如表面张力或温度、从一个气象台网络中观测到的数据、来自社交网络或协同过滤的数据,这些数据都不能直接应用CNN。虽然CNN可以应用于多层,但是在特征维度上没有假设任何几何属性,导致一个4-D tensor只能沿其空间坐标进行卷积,即对于一个4-D的tensor而言,其有IY7E7852S8L0ESBP0Y6A%C0.png四个维度,典型的CNN只能对]S)}$RDK2{0RM]ZPJ@O8OM2.png三个维度(即空间维度)进行卷积操作(通过3D convolution 操作),而不能对[`SH0T$R_A2PBOQX{T4RJH2.png维度(特征维度)进行操作。


网络提供了低维网格数据的一种泛化的框架,也就是GCN是CNN在domain上的推广,推广的方式是通过推广卷积的概念。在本文中将会讨论将深度卷积应用于网络数据的方法。本文一共提供两种架构。第一种为空域架构(spatial construction),这种架构能够对网络数据应用上述②和③,应用它们可以构建网络数据的局部连接网络,参数复杂度为PWDP22[%PZ4VNU0)CFZ7T)2.png而非BAJ@GQ7@QSK_XK7{ZZL5JQG.png。另一种架构称为频域架构(spectral construction),能够在傅里叶域内应用卷积。频域架构对于每一个feature map最多需要PWDP22[%PZ4VNU0)CFZ7T)2.png的参数复杂度,也可以构建参数数量与XU]R1OZUHRG%2E48$XAYENB.png无关的架构。这两种架构都可以应用高效的前向传播并且能够应用在有多个坐标的数据的数据集上。



二、空域架构


YD8XM04DAUZS2G8335G6I77.png


  1. 图的多尺度聚类


CNN通过池化和下采样来降低网格的大小,这一操作也就是网格的多尺度聚类( multiscale clustering):为每个cluster输入多个特征,输出一个特征。在图上被证明更为有效的聚类方法仍然有待研究,在本文中选择了一种比较朴素的聚类方法。如下图所示,下图中有两层聚类,灰色的点为数据中的无向图节点,然后进行聚类得到下一层带颜色的节点,然后再对这些带颜色的节点进行聚类,第一层为12个节点,第二层6个节点,第三层3个节点:


MF}YI1D4$8NJV7%YDENN3XL.png

                                                  图上的聚类


  1. 深度局部连接网络


LPG8L)2EAEA9KBMQ`7@UMBP.png

$BMR0F0$)_]_ZJDK5~%Q(SR.png

                                               空域架构


[~NB[$_T56~RTFZODAEEQ~L.png


  1. 评价


这种架构的优点在于不需要很强的前提假设,只需要图具备邻域结构即可,甚至不需要很好的embedding向量。但是缺点在于没办法进行参数共享,对于每一层的每一个节点都要有单独的参数进行卷积而不能像CNN那样使用同一个卷积核在数据网格上进行平移。


三、频域架构


  1. 图的拉普拉斯矩阵


]L~]`SA2EYXUI773W@@H`HJ.png

③Random walk normalized Laplacian,也就是随机游走归一化拉普拉斯矩阵:


YDO6VIAG@IA9)_XVRYX29G2.png


  1. 加权图的调和分析


QC840~TU3`W6P9HJ3)DVL0A.png

X53RU(~]I%ATZV2XL_)_}`R.png


上面提到的一组特征向量其实就是PWA(8@LF$)2GL${9N2LOBIR.png空间的一组基,前面的文章里说过图傅里叶变换其实就是将信号向量投影到拉普拉斯矩阵的各个特征向量上:


TTF)3`L68W{(0U8ZOTMLF51.png

特征值的大小表示平滑程度,它对应传统傅里叶变换中的频率,频率高表示短时间内变动多,和这里的相邻节点变动大(变动越大越不平滑)能对应起来。因此图傅里叶变换就是在将一个图信号分解到不同平滑程度的图信号上,就像传统傅里叶变换将函数分解到不同频率的函数上一样。


3W]D`{6~W00W26NCC_JUF]D.png

YJ(8CB602~{5JO5F04SV[86.png


  1. 图卷积


两个函EP`KH_C3%]O5BTF3$37`4KG.png数和B3SE{C{EJM{4JNFL(_IJD@I.png进行卷积可以应用卷积定理,用公式表达卷积定理就是:

]))V~GA6`LD[I]}Q(T_LY2W.png


应用卷积定理可以在频域上进行图的卷积操作,具体的方法是将滤波器IOTSPST}FOTOS}WW5~(MKJI.png和图信号GA4VI16DWBRNKT$@7XX)HLE.png都通过图傅里叶变换转换到频域然后计算转换后的结果的乘积(哈达玛积,也就是向量对应元素相乘),然后将相乘的结果再通过图傅里叶逆变换转换回空域,整个过程如下:


OL`N_~U4(308G$(PAZ4HQ$O.png

FYTYVUQ0S9S2TCKB7%%[QNW.png


  1. 频域架构


VJP7BV$EOTPG({`[X8]HD]L.png


四、实验


本文中提出的两种架构在两个数据集上进行了实验验证效果。具体实验设置参看原论文,这里不做赘述。


  1. 采样MNIST数据集


这个数据集是从MNIST数据集的每张图片()上采样个样本点构建图。实验样本如下图:


%Y@054%FFQP74QB7~9P5T45.png

                                                  样本


实验结果如下图所示:


@_D3SB@7]WK0N~~2N67IDV5.png

                                                    结果


  1. 球体上的MNIST数据集


这个数据集将MNIST数据集中的样本提升到3维空间中。实验样本如下图:


){2($VGHV~VIADNM%HD%GBV.png

                                                          样本


实验结果如下图所示:


S]]ZJLQ0@~OL~GQ`X4~G9JR.png

                                              结果1


81WW48$X2QQY7WE}1DMK__N.png

                                               结果2


参考资料


ref:图傅里叶变换


ref:paper reading:[第一代GCN] Spectral Networks and Deep Locally Connected Networks on Graphs

相关文章
|
14天前
|
机器学习/深度学习 计算机视觉 Python
【YOLOv11改进 - 注意力机制】SimAM:轻量级注意力机制,解锁卷积神经网络新潜力
【YOLOv11改进 - 注意力机制】SimAM:轻量级注意力机制,解锁卷积神经网络新潜力本文提出了一种简单且高效的卷积神经网络(ConvNets)注意力模块——SimAM。与现有模块不同,SimAM通过优化能量函数推断特征图的3D注意力权重,无需添加额外参数。SimAM基于空间抑制理论设计,通过简单的解决方案实现高效计算,提升卷积神经网络的表征能力。代码已在Pytorch-SimAM开源。
【YOLOv11改进 - 注意力机制】SimAM:轻量级注意力机制,解锁卷积神经网络新潜力
|
7天前
|
机器学习/深度学习 人工智能 自然语言处理
深度学习中的卷积神经网络:从理论到实践
【10月更文挑战第35天】在人工智能的浪潮中,深度学习技术以其强大的数据处理能力成为科技界的宠儿。其中,卷积神经网络(CNN)作为深度学习的一个重要分支,在图像识别和视频分析等领域展现出了惊人的潜力。本文将深入浅出地介绍CNN的工作原理,并结合实际代码示例,带领读者从零开始构建一个简单的CNN模型,探索其在图像分类任务中的应用。通过本文,读者不仅能够理解CNN背后的数学原理,还能学会如何利用现代深度学习框架实现自己的CNN模型。
|
6天前
|
机器学习/深度学习 人工智能 算法框架/工具
深度学习中的卷积神经网络(CNN)及其在图像识别中的应用
【10月更文挑战第36天】探索卷积神经网络(CNN)的神秘面纱,揭示其在图像识别领域的威力。本文将带你了解CNN的核心概念,并通过实际代码示例,展示如何构建和训练一个简单的CNN模型。无论你是深度学习的初学者还是希望深化理解,这篇文章都将为你提供有价值的见解。
|
17天前
|
机器学习/深度学习 监控 自动驾驶
卷积神经网络有什么应用场景
【10月更文挑战第23天】卷积神经网络有什么应用场景
18 2
|
18天前
|
物联网 5G 数据中心
|
17天前
|
机器学习/深度学习 自然语言处理 算法
什么是卷积神经网络
【10月更文挑战第23天】什么是卷积神经网络
24 1
|
21天前
|
Docker 容器
docker swarm启动服务并连接到网络
【10月更文挑战第16天】
20 5
|
20天前
|
机器学习/深度学习 人工智能 算法
【车辆车型识别】Python+卷积神经网络算法+深度学习+人工智能+TensorFlow+算法模型
车辆车型识别,使用Python作为主要编程语言,通过收集多种车辆车型图像数据集,然后基于TensorFlow搭建卷积网络算法模型,并对数据集进行训练,最后得到一个识别精度较高的模型文件。再基于Django搭建web网页端操作界面,实现用户上传一张车辆图片识别其类型。
65 0
【车辆车型识别】Python+卷积神经网络算法+深度学习+人工智能+TensorFlow+算法模型
|
21天前
|
机器学习/深度学习 人工智能 自动驾驶
深度学习中的卷积神经网络(CNN)及其应用
【10月更文挑战第21天】本文旨在深入探讨深度学习领域的核心组成部分——卷积神经网络(CNN)。通过分析CNN的基本结构、工作原理以及在图像识别、语音处理等领域的广泛应用,我们不仅能够理解其背后的技术原理,还能把握其在现实世界问题解决中的强大能力。文章将用浅显的语言和生动的例子带领读者一步步走进CNN的世界,揭示这一技术如何改变我们的生活和工作方式。
|
28天前
|
安全 网络架构
无线网络:连接未来的无形纽带
【10月更文挑战第13天】
63 8

热门文章

最新文章