第三代图卷积网络:使用图卷积网络进行半监督分类

简介: 第三代图卷积网络:使用图卷积网络进行半监督分类

论文标题:Semi-Supervised Classification with Graph Convolutional Networks


论文链接:https://arxiv.org/abs/1609.02907


论文来源:ICLR 2017


之前的文章:


傅里叶级数与傅里叶变换


图神经网络中的谱图理论基础


第一代图卷积网络:图的频域网络与深度局部连接网络


第二代图卷积网络:应用快速局部谱卷积的图卷积网络


一、概述


考虑分类图中节点这样一个问题,每个节点可以是一篇文章,那么图可以代表引用关系,并且只有一部分节点有标签。这样的问题就是一个基于图的半监督学习问题。解决这个问题的一种方法是为损失函数添加一个基于图的正则项,比如采用图的拉普拉斯矩阵正则项:


MK(5W(3WM81M{@2Z~}}W)IU.png


上式之所以能够采用这样的损失函数是基于这样的假设:在图中相邻的节点更倾向于拥有相同的标签。然而这个假设可能会限制模型的容量,因为图的边不一定需要编码节点相似度,但可能包含额外的信息。


CKTLAO{0WW_(XQU`5V5@@{3.png


本文主要内容包括三部分:


①网络的架构,也就是设计的卷积层是如何前向传播的,以及它如何从前两代GCN中获得启发并对其进行改进;


②如何利用设计的GCN解决前述半监督问题;


③通过实验来证明本文设计的模型是有效且高效的。


二、图上的快速近似卷积


在本文中所设计的GCN的卷积层结构如下:


O1DL6VJ7U4)MGOJD6`7@[`R.png


  1. 谱卷积核


QZWG5JO1CPF)$VXZ3LMS{HE.png


  1. 第三代谱卷积核


上面介绍了前两代谱卷积核,本节介绍如何由第二代谱卷积核进行改进从而得到本文所设计的第三代谱卷积核。对于第二代卷积核,首先我们设置,那么现在有:


2%6XL9[L]I48N%}L7$`T8L1.png

上式和K]}ZJ@(ZV$`V{X8KY4HCH}R.png,也仍然可以通过堆叠多层来使得模型具备足够的容量和复杂度,而且本文认为这样设置还可以缓解社交网络、引文网络、知识图谱或者其他真实世界的这种大规模图的局部邻域的过拟合问题。另外,这样的设计也能够允许我们构建更深的深度网络。

接着,本文近似使用8N~$$Q}RQB3%IF4VHREL[0D.png,本文认为在训练过程中神经网络可以适应这种假设,那么现在,卷积的过程就变成:


Y9V]5MD[P8`K1PWG6{EC87B.png

一共有两个参数]N1U(B_9{JFP@%W(R_1SN1Z.png。连续应用这种卷积层也可以达到卷积图的HZ32[VU(3}{QNQAT8CY5DZ7.png阶邻域的效果,这是由于每次卷积NPXL6F$`JGWM0ZUG{9IT1DF.png阶邻域内的节点信息都会流向当前节点,这里的HZ32[VU(3}{QNQAT8CY5DZ7.png代表连续的卷积操作数或者卷积的层数。


接下来进一步限制参数的数量以解决过拟合和最小化每层的操作(如矩阵乘法)的数量,具体的,限制0BPVBY)%]FK2263{FSOO_76.png,现在卷积的过程就变成:

W]0M[51`5B)T{4GRN4J6X07.png


现在的特征之间。在深度神经网络中重复应用上述过程会造成数值不稳定以及梯度爆炸或梯度消失,为了缓解这个问题,本文采用再标准化(renormalization)技巧:


L{V6IJGV45[52JQHJWS)UKB.png


三、半监督节点分类


正如之前所说的,对于半监督分类问题,由于我们将数据~~7U($T5R1O00W~4}5MC%J9.png和邻接矩阵IWJE2W}0G~}NKN%2VIU))U3.png同时作为模型(GJG%$5~5PL%_YCB{@VZ_}M.png的输入条件,因而我们可以放宽某些典型的基于图的半监督学习的假设。我们期待这种方法在邻接矩阵包含~~7U($T5R1O00W~4}5MC%J9.png种没有的信息时能够是powerful的,解释一下这一点就是说传统的基于图的半监督学习(正如开篇介绍的)要求图的邻接矩阵表征节点的相似度,而节点的相似度信息是利用~~7U($T5R1O00W~4}5MC%J9.png计算得到的,也就是说~~7U($T5R1O00W~4}5MC%J9.png本身就包含相似度信息,这就造成了重复和浪费,而使用本文的模型后,邻接矩阵就可以用来表征一些其他


信息(比如文章的引用关系或者知识图谱中的关系),相当于将邻接矩阵解放了出来。



对于模型的具体架构,使用一个两个卷积层的神经网络作为例子。在预处理阶段首先计算D}EKRNT}RPGP345[A7VN)KV.png,然后模型架构可以表示为:

WYDICI22YU%0`QH$7$@Z5_P.png


DSV[)HGA_6@9EZ43NEQJL53.png


{}3L809`71EIPFKS(F71]@0.png

                                                       架构图


在实验中采用batch gradient descent对整个数据集进行迭代。对于稀疏矩阵559%OCUQDBNH21Y7(27%481.png,需要的内存复杂度为A3Z8T%2B5[YUFK6]D@OYL]M.png。随机性通过dropout引入。对于mini-batch stochastic gradient descent的方法需要后续进行研究。


四、实验


实验数据集信息如下:


GN[LPL0S3E2AS)BNOI1JN7J.png

                                                数据集信息


实验结果如下:


WDMH}R@[}]~CMS`V~T46KQ7.png

                                                 实验结果


具体实验设置请参照原文。


多种架构对比:


Q)CZPPX(5]H]G84TO%PWAFB.png

                                           多种架构对比


训练时间与图边数的关系:


EIJRSJ}O5JZQO_IRM(K~K(3.png

                                  训练时间与图边数的关系


五、模型的局限性


  1. 内存的需求


采用batch gradient descent,内存需求与图边数成线性关系。而如果采用mini-batch,则需要考虑模型的层数,因为模型的层数代表了卷积的感受野,对于非常大且稠密连接的图,可能需要更进一步的近似。


  1. 有向图和边的特征


本文提出的模型只适用于无向图模型。不过NELL数据集的结果表明,通过将原始有向图表示为无向二部图,并使用额外的节点表示原始图中的边,可以同时处理有向边和边的特征。


  1. 有限的假设


前述模型的定义有两个假设:

①局部性假设,也就是A~_4LN2O`B4O6BNOW{{[}OC.png层对应A~_4LN2O`B4O6BNOW{{[}OC.png阶邻域的假设;

②自连接与相邻节点的边等同重要性,也就是TW_A}S[Y(YA$PHYTDO56TKD.png

对于一些数据集,最好引入一个权衡参数:


BP9]J7]GUQ%@ILC}))C1UCF.png


这个权衡参数可以被学习。

相关文章
|
22天前
|
机器学习/深度学习 算法 TensorFlow
动物识别系统Python+卷积神经网络算法+TensorFlow+人工智能+图像识别+计算机毕业设计项目
动物识别系统。本项目以Python作为主要编程语言,并基于TensorFlow搭建ResNet50卷积神经网络算法模型,通过收集4种常见的动物图像数据集(猫、狗、鸡、马)然后进行模型训练,得到一个识别精度较高的模型文件,然后保存为本地格式的H5格式文件。再基于Django开发Web网页端操作界面,实现用户上传一张动物图片,识别其名称。
53 1
动物识别系统Python+卷积神经网络算法+TensorFlow+人工智能+图像识别+计算机毕业设计项目
|
16天前
|
机器学习/深度学习 人工智能 自然语言处理
深度学习中的卷积神经网络(CNN)及其应用
【9月更文挑战第24天】本文将深入探讨深度学习中的一种重要模型——卷积神经网络(CNN)。我们将通过简单的代码示例,了解CNN的工作原理和应用场景。无论你是初学者还是有经验的开发者,这篇文章都将为你提供有价值的信息。
45 1
|
21天前
|
机器学习/深度学习 人工智能 自动驾驶
深度学习中的卷积神经网络(CNN)及其在图像识别中的应用
【9月更文挑战第19天】在人工智能的浩瀚星海中,卷积神经网络(CNN)如同一颗璀璨的星辰,照亮了图像处理的天空。本文将深入CNN的核心,揭示其在图像识别领域的强大力量。通过浅显易懂的语言和直观的比喻,我们将一同探索CNN的奥秘,并见证它如何在现实世界中大放异彩。
|
21天前
|
机器学习/深度学习 人工智能 算法
植物病害识别系统Python+卷积神经网络算法+图像识别+人工智能项目+深度学习项目+计算机课设项目+Django网页界面
植物病害识别系统。本系统使用Python作为主要编程语言,通过收集水稻常见的四种叶片病害图片('细菌性叶枯病', '稻瘟病', '褐斑病', '稻瘟条纹病毒病')作为后面模型训练用到的数据集。然后使用TensorFlow搭建卷积神经网络算法模型,并进行多轮迭代训练,最后得到一个识别精度较高的算法模型,然后将其保存为h5格式的本地模型文件。再使用Django搭建Web网页平台操作界面,实现用户上传一张测试图片识别其名称。
72 21
植物病害识别系统Python+卷积神经网络算法+图像识别+人工智能项目+深度学习项目+计算机课设项目+Django网页界面
|
21天前
|
机器学习/深度学习 人工智能 算法
鸟类识别系统Python+卷积神经网络算法+深度学习+人工智能+TensorFlow+ResNet50算法模型+图像识别
鸟类识别系统。本系统采用Python作为主要开发语言,通过使用加利福利亚大学开源的200种鸟类图像作为数据集。使用TensorFlow搭建ResNet50卷积神经网络算法模型,然后进行模型的迭代训练,得到一个识别精度较高的模型,然后在保存为本地的H5格式文件。在使用Django开发Web网页端操作界面,实现用户上传一张鸟类图像,识别其名称。
71 12
鸟类识别系统Python+卷积神经网络算法+深度学习+人工智能+TensorFlow+ResNet50算法模型+图像识别
|
2天前
|
机器学习/深度学习 算法 数据安全/隐私保护
基于GA遗传优化的GroupCNN分组卷积网络时间序列预测算法matlab仿真
该算法结合了遗传算法(GA)与分组卷积神经网络(GroupCNN),利用GA优化GroupCNN的网络结构和超参数,提升时间序列预测精度与效率。遗传算法通过模拟自然选择过程中的选择、交叉和变异操作寻找最优解;分组卷积则有效减少了计算成本和参数数量。本项目使用MATLAB2022A实现,并提供完整代码及视频教程。注意:展示图含水印,完整程序运行无水印。
|
20天前
|
机器学习/深度学习 算法 TensorFlow
交通标志识别系统Python+卷积神经网络算法+深度学习人工智能+TensorFlow模型训练+计算机课设项目+Django网页界面
交通标志识别系统。本系统使用Python作为主要编程语言,在交通标志图像识别功能实现中,基于TensorFlow搭建卷积神经网络算法模型,通过对收集到的58种常见的交通标志图像作为数据集,进行迭代训练最后得到一个识别精度较高的模型文件,然后保存为本地的h5格式文件。再使用Django开发Web网页端操作界面,实现用户上传一张交通标志图片,识别其名称。
46 6
交通标志识别系统Python+卷积神经网络算法+深度学习人工智能+TensorFlow模型训练+计算机课设项目+Django网页界面
|
16天前
|
机器学习/深度学习 人工智能 算法
【新闻文本分类识别系统】Python+卷积神经网络算法+人工智能+深度学习+计算机毕设项目+Django网页界面平台
文本分类识别系统。本系统使用Python作为主要开发语言,首先收集了10种中文文本数据集("体育类", "财经类", "房产类", "家居类", "教育类", "科技类", "时尚类", "时政类", "游戏类", "娱乐类"),然后基于TensorFlow搭建CNN卷积神经网络算法模型。通过对数据集进行多轮迭代训练,最后得到一个识别精度较高的模型,并保存为本地的h5格式。然后使用Django开发Web网页端操作界面,实现用户上传一段文本识别其所属的类别。
31 1
【新闻文本分类识别系统】Python+卷积神经网络算法+人工智能+深度学习+计算机毕设项目+Django网页界面平台
|
9天前
|
机器学习/深度学习 人工智能 算法
深入理解卷积神经网络:从理论到实践
【9月更文挑战第31天】在深度学习的众多模型之中,卷积神经网络(CNN)以其在图像处理领域的出色表现而闻名。本文将通过浅显易懂的语言和直观的比喻,带领读者了解CNN的核心原理和结构,并通过一个简化的代码示例,展示如何实现一个简单的CNN模型。我们将从CNN的基本组成出发,逐步深入到其在现实世界中的应用,最后探讨其未来的可能性。文章旨在为初学者提供一个清晰的CNN入门指南,同时为有经验的开发者提供一些深入思考的视角。
|
9天前
|
机器学习/深度学习 人工智能 算法框架/工具
深度学习中的卷积神经网络(CNN)及其在图像识别中的应用
【9月更文挑战第31天】本文旨在通过浅显易懂的语言和直观的比喻,为初学者揭开深度学习中卷积神经网络(CNN)的神秘面纱。我们将从CNN的基本原理出发,逐步深入到其在图像识别领域的实际应用,并通过一个简单的代码示例,展示如何利用CNN进行图像分类。无论你是编程新手还是深度学习的初学者,这篇文章都将为你打开一扇通往人工智能世界的大门。