备案控制台

开发者社区人工智能文章正文

Deep Graph Infomax：互信息最大化的无监督图对比学习

2022-06-12 825

版权

版权声明：

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： Deep Graph Infomax：互信息最大化的无监督图对比学习

论文标题：DEEP GRAPH INFOMAX

论文链接：https://arxiv.org/abs/1809.10341

论文来源：ICLR 2019

之前的相关博客：

MINE：随机变量互信息的估计方法

Deep InfoMax：基于互信息最大化的表示学习

一、概述

目前主流的无监督图表示学习方法主要依赖于基于随机游走的，然而这一类的方法受到诸多限制。最显著的是，已知的随机游走目标过分强调接近性信息，而牺牲了结构信息，并且方法的效果高度依赖于超参数的选择。本文提出的方法基于互信息估计，依赖于训练一个统计网络作为分类器来区分开组两个随机变量联合分布和边缘分布乘积的样本。本文的方法从Deep InfoMax改进而来，称为Deep Graph Infomax，可以应用在直推式和归纳式的图表示学习任务中。

二、方法

无监督图表示学习

局部-全局互信息最大化

所有patch表示都被驱动保持与图表示的互信息，这有助于保持patch层级的相似性，举例来说，图中距离较远但是有相同结构特征的节点之间可以建立联系。

算法

假设在单图情况下，Deep Graph Infomax的算法流程如下：

下图以一种直观的方式展示了算法的流程：

算法

三、实验

本文对直推式（transductive）和归纳式（inductive）任务都进行了实验，其中既包括单图配置，也包括多图配置，并且主要进行分类任务实验。在实验中DGI在完全无监督的情况下学习表示，然后使用简单分类器（逻辑回归）进行微调。

数据集

下表展示了本次实验的数据集配置情况：

数据集

实验设置

对于不同类型（直推式、大图归纳式以及多图归纳式）的实验，采用不同的encoder和破坏函数。

直推式学习

encoder采用一个一层GCN：

大图上的归纳式学习（只有Reddit数据集）

由于GCN的卷积核严重依赖于固定和已知的邻接矩阵，所以在当前配置下采用mean-pooling传播规则的GraphSAGE-GCN：

破坏函数与直推式配置类似，但是将minibatch内每个节点采样得到的子图看做独立的图进行破坏（也就是按照行单独打乱这些子图的特征）。这很可能使得中心节点在负样本图中的特征被替换为采样邻居的特征，从而增加了负样本的多样性。最后在中心节点中得到的patch表示被输入给discriminator。

上述过程如下图所示：

框架

多图上的归纳式学习（只有PPI数据集）

对于PPI数据集，受以前成功的监督架构的启发，该配置下的encoder如下：

负样本就是训练集中的其他图，为了增强负样本的多样性，也会对采样到的负样本图的特征进行dropout。另外实验发现，在将学习到的表示提供给逻辑回归模型之前，将它们标准化是有益的。

Readout, discriminator等

不同的数据集配置采用同样的readout函数和discriminator架构。

Readout函数采用简单的节点特征平均：

另外所有模型使用Glorot initialization初始化，其他具体实验设置参看原文。

实验结果

下图展示了在多个数据集上的实验结果：

实验

另外使用t-SNE进行了特征的可视化：

t-SNE

文章标签：

机器学习/深度学习

知识图谱

数据可视化

算法

酷酷的群

目录

相关文章

楠竹11

|

6月前

|

机器学习/深度学习人工智能自然语言处理

ICLR 2024 Spotlight：训练一个图神经网络即可解决图领域所有分类问题！

【2月更文挑战第17天】ICLR 2024 Spotlight：训练一个图神经网络即可解决图领域所有分类问题！

楠竹11

196 2 2

ICLR 2024 Spotlight：训练一个图神经网络即可解决图领域所有分类问题！

小小杨树1

|

6月前

|

机器学习/深度学习算法内存技术

【CVPR2021】CondenseNetV2:用于深度网络的稀疏特征再激活

【CVPR2021】CondenseNetV2:用于深度网络的稀疏特征再激活

小小杨树1

157 2 2

【CVPR2021】CondenseNetV2:用于深度网络的稀疏特征再激活

知与谁同

|

机器学习/深度学习测试技术

【深度神经网络 One-shot Learning】孪生网络少样本精准分类

知与谁同

9957 0 0

汀丶人工智能

|

机器学习/深度学习人工智能自然语言处理

PGL图学习之图神经网络GNN模型GCN、GAT[系列六]

本次项目讲解了图神经网络的原理并对GCN、GAT实现方式进行讲解，最后基于PGL实现了两个算法在数据集Cora、Pubmed、Citeseer的表现，在引文网络基准测试中达到了与论文同等水平的指标。目前的数据集样本节点和边都不是很大，下个项目将会讲解面对亿级别图应该如何去做。

汀丶人工智能

444 0 1

拓端数据部落

|

6月前

|

存储算法前端开发

R语言中贝叶斯网络（BN）、动态贝叶斯网络、线性模型分析错颌畸形数据

R语言中贝叶斯网络（BN）、动态贝叶斯网络、线性模型分析错颌畸形数据

拓端数据部落

110 0 0

Deephub

|

6月前

|

机器学习/深度学习存储 PyTorch

使用pytorch构建图卷积网络预测化学分子性质

在本文中，我们将通过化学的视角探索图卷积网络，我们将尝试将网络的特征与自然科学中的传统模型进行比较，并思考为什么它的工作效果要比传统的方法好。

Deephub

75 0 0

星辰大海AI领航

|

6月前

|

机器学习/深度学习自然语言处理算法

【论文精读】COLING 2022 -带有对偶关系图注意力网络的事件检测模型

【论文精读】COLING 2022 -带有对偶关系图注意力网络的事件检测模型

星辰大海AI领航

130 0 0

汀丶人工智能

|

机器学习/深度学习存储自然语言处理

机器学习算法（一）: 基于逻辑回归的分类预测

机器学习算法（一）: 基于逻辑回归的分类预测

汀丶人工智能

24040 1 1

机器学习算法（一）: 基于逻辑回归的分类预测

-开发达人-

|

机器学习/深度学习存储算法

优于GNN嵌入基线，阿尔伯塔大学等用RL做图关系推理：关系预测任务新SOTA

优于GNN嵌入基线，阿尔伯塔大学等用RL做图关系推理：关系预测任务新SOTA

-开发达人-

115 0 1

Deephub

|

机器学习/深度学习自然语言处理大数据

使用Flow forecast进行时间序列预测和分类的迁移学习介绍

使用Flow forecast进行时间序列预测和分类的迁移学习介绍

Deephub

358 0 0

使用Flow forecast进行时间序列预测和分类的迁移学习介绍

热门文章

最新文章

Java 生成 UUID

一文读懂 Serverless 的起源、发展和落地实践

Fiddler抓包：下载、安装及使用

用CodeViz绘制函数调用关系图(call graph)

阿里AI上岗双11服装车间，能识别头发丝直径十分之一的瑕疵

SpringBoot开发案例之整合Dubbo提供者(一)

Dubbo架构介绍

警惕垃圾邮件借加沙新闻进行钓鱼攻击

美国博客刊文发布NetApp StoreVault停产通知

IntelliJ IDEA 12 创建Web项目教程超详细版

通义灵码与云计算平台的融合：基础与概述

《深度解析：死锁的“前世今生”与防范之道》

《探秘程序崩溃：核心转储（Core Dump）分析全攻略》

今日 AI 开源｜共 12 项｜开源的DIY健康追踪项目，基于低成本的智能戒指构建私人的健康监测应用

Open Interpreter：AI 赋能终端！在终端中对话AI模型进行编程，通过运行代码来完成各种计算机操作任务

「Mac畅玩鸿蒙与硬件15」鸿蒙UI组件篇5 - Slider 和 Progress 组件

ai断点怎么做?

AI Shell：在命令行里“对话” AI ，微软推出将 AI 助手引入命令行的 CLI 工具，打造对话式交互命令行

ai怎么设计迷宫字体效果?

「Mac畅玩鸿蒙与硬件14」鸿蒙UI组件篇4 - Toggle 和 Checkbox 组件

相关课程

更多

神经网络概览及算法详解

【算法实战】7. 集成方法-随机森林

【算法实战】8. 集成方法-Adaboost

机器学习基础与回归算法

【算法实战】10. 树回归算法

【算法实战】5. Logistic回归算法

相关电子书

更多

纯干货|机器学习中梯度下降法的分类及对比分析

纯干货 | 机器学习中梯度下降法的分类及对比分析

机器能理解上下文吗 RNN和LSTM神经网络的原理及应用

相关实验场景

更多

以客服场景意图分类为例写Prompt

如何快速训练大模型

使用PAI+LLaMA Factory微调Qwen2-VL模型，搭建文旅领域知识问答机器人

使用PAI-快速开始，低代码实现大语言模型微调和部署

AIGC Stable Diffusion文生图Lora模型微调实现虚拟上装

推荐系统入门之使用ALS算法实现打分预测

下一篇

阿里云OSS设置跨域访问