备案控制台

开发者社区人工智能文章正文

Deep Graph Infomax：互信息最大化的无监督图对比学习

2022-06-12 853

版权

版权声明：

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： Deep Graph Infomax：互信息最大化的无监督图对比学习

论文标题：DEEP GRAPH INFOMAX

论文链接：https://arxiv.org/abs/1809.10341

论文来源：ICLR 2019

之前的相关博客：

MINE：随机变量互信息的估计方法

Deep InfoMax：基于互信息最大化的表示学习

一、概述

目前主流的无监督图表示学习方法主要依赖于基于随机游走的，然而这一类的方法受到诸多限制。最显著的是，已知的随机游走目标过分强调接近性信息，而牺牲了结构信息，并且方法的效果高度依赖于超参数的选择。本文提出的方法基于互信息估计，依赖于训练一个统计网络作为分类器来区分开组两个随机变量联合分布和边缘分布乘积的样本。本文的方法从Deep InfoMax改进而来，称为Deep Graph Infomax，可以应用在直推式和归纳式的图表示学习任务中。

二、方法

无监督图表示学习

局部-全局互信息最大化

所有patch表示都被驱动保持与图表示的互信息，这有助于保持patch层级的相似性，举例来说，图中距离较远但是有相同结构特征的节点之间可以建立联系。

算法

假设在单图情况下，Deep Graph Infomax的算法流程如下：

下图以一种直观的方式展示了算法的流程：

算法

三、实验

本文对直推式（transductive）和归纳式（inductive）任务都进行了实验，其中既包括单图配置，也包括多图配置，并且主要进行分类任务实验。在实验中DGI在完全无监督的情况下学习表示，然后使用简单分类器（逻辑回归）进行微调。

数据集

下表展示了本次实验的数据集配置情况：

数据集

实验设置

对于不同类型（直推式、大图归纳式以及多图归纳式）的实验，采用不同的encoder和破坏函数。

直推式学习

encoder采用一个一层GCN：

大图上的归纳式学习（只有Reddit数据集）

由于GCN的卷积核严重依赖于固定和已知的邻接矩阵，所以在当前配置下采用mean-pooling传播规则的GraphSAGE-GCN：

破坏函数与直推式配置类似，但是将minibatch内每个节点采样得到的子图看做独立的图进行破坏（也就是按照行单独打乱这些子图的特征）。这很可能使得中心节点在负样本图中的特征被替换为采样邻居的特征，从而增加了负样本的多样性。最后在中心节点中得到的patch表示被输入给discriminator。

上述过程如下图所示：

框架

多图上的归纳式学习（只有PPI数据集）

对于PPI数据集，受以前成功的监督架构的启发，该配置下的encoder如下：

负样本就是训练集中的其他图，为了增强负样本的多样性，也会对采样到的负样本图的特征进行dropout。另外实验发现，在将学习到的表示提供给逻辑回归模型之前，将它们标准化是有益的。

Readout, discriminator等

不同的数据集配置采用同样的readout函数和discriminator架构。

Readout函数采用简单的节点特征平均：

另外所有模型使用Glorot initialization初始化，其他具体实验设置参看原文。

实验结果

下图展示了在多个数据集上的实验结果：

实验

另外使用t-SNE进行了特征的可视化：

t-SNE

文章标签：

机器学习/深度学习

知识图谱

数据可视化

算法

酷酷的群

目录

相关文章

Deephub

|

8月前

|

机器学习/深度学习存储 PyTorch

使用pytorch构建图卷积网络预测化学分子性质

在本文中，我们将通过化学的视角探索图卷积网络，我们将尝试将网络的特征与自然科学中的传统模型进行比较，并思考为什么它的工作效果要比传统的方法好。

Deephub

99 0 0

Matlab科研工作室

|

机器学习/深度学习传感器算法

Matlab 向量加权优化双向长短期记忆网络(INFO-BILSTM)的回归预测

Matlab 向量加权优化双向长短期记忆网络(INFO-BILSTM)的回归预测

Matlab科研工作室

93 0 0

Matlab科研工作室

|

机器学习/深度学习传感器算法

贝叶斯优化 | Matlab BO-LSTM贝叶斯优化长短期记忆网络分类预测

贝叶斯优化 | Matlab BO-LSTM贝叶斯优化长短期记忆网络分类预测

Matlab科研工作室

182 0 0

Matlab科研工作室

|

机器学习/深度学习传感器自然语言处理

贝叶斯优化 | Matlab BO-BILSTM贝叶斯优化双向长短期记忆网络分类预测

贝叶斯优化 | Matlab BO-BILSTM贝叶斯优化双向长短期记忆网络分类预测

Matlab科研工作室

547 0 0

机器学习之心

|

机器学习/深度学习

时序预测 | MATLAB实现基于CNN-LSTM卷积长短期记忆神经网络的时间序列预测-递归预测未来(多指标评价)

时序预测 | MATLAB实现基于CNN-LSTM卷积长短期记忆神经网络的时间序列预测-递归预测未来(多指标评价)

机器学习之心

252 0 0

机器学习之心

|

机器学习/深度学习

时序预测 | MATLAB实现基于CNN-BiLSTM卷积双向长短期记忆神经网络的时间序列预测-递归预测未来(多指标评价)

时序预测 | MATLAB实现基于CNN-BiLSTM卷积双向长短期记忆神经网络的时间序列预测-递归预测未来(多指标评价)

机器学习之心

217 0 0

倪桦

|

机器学习/深度学习算法

学习笔记：机器学习经典算法-决策边界（decision boundary）

机器学习经典算法-个人笔记和学习心得分享

倪桦

939 0 0

学习笔记：机器学习经典算法-决策边界（decision boundary）

随风飘摇的土木狗

|

机器学习/深度学习数据采集算法

【MATLAB第10期】基于贝叶斯Bayes算法优化LSTM长短期记忆网络的多输入单输出回归预测模型思路框架

【MATLAB第10期】基于贝叶斯Bayes算法优化LSTM长短期记忆网络的多输入单输出回归预测模型思路框架

随风飘摇的土木狗

165 0 0

随风飘摇的土木狗

|

机器学习/深度学习数据处理数据格式

【MATLAB第12期】基于LSTM长短期记忆网络的多输入多输出回归预测模型思路框架，含滑动窗口，预测未来，单步预测与多步预测对比，多步预测步数对预测结果影响分析

【MATLAB第12期】基于LSTM长短期记忆网络的多输入多输出回归预测模型思路框架，含滑动窗口，预测未来，单步预测与多步预测对比，多步预测步数对预测结果影响分析

随风飘摇的土木狗

508 0 0

Deephub

|

机器学习/深度学习算法数据挖掘

使用图进行特征提取：最有用的图特征机器学习模型介绍

使用图进行特征提取：最有用的图特征机器学习模型介绍

Deephub

510 0 0

使用图进行特征提取：最有用的图特征机器学习模型介绍

热门文章

最新文章

如何优雅打印nginx header和body

Swin Transformer实战：使用 Swin Transformer实现图像分类

5G中的调制技术：从QPSK到256QAM，赋能高速率通信

数据包络分析（DEA）

mysql 8.0 使用 XtraBackup增量备份及恢复

MFC中将编辑框文本转换成整数，从而实现两个整数相加。

现在到底还该不该买房？

为企业用户分析PR策略，TrendKite获1630万美元融资

运维平台的建设思考-元数据管理（二）

uploadify2.1.4上传组件应用实例

操作系统智能助手OS Copilot新功能上线，快来体验吧

超好看的404提示页面HTML源码

【05】flutter完成注册页面完善样式bug-增加自定义可复用组件widgets-严格规划文件和目录结构-规范入口文件-开发完整的社交APP-前端客户端开发+数据联调|以优雅草商业项目为例做开发-flutter开发-全流程-商业应用级实战开发-优雅草央千澈

[Git] 深入理解 Git 的客户端与服务器角色

[Git] 如何理解及基础操作

[Linux工具] Makefile

为什么C/C++编译腰要先完成汇编

深入理解GCC 和 G++ 编译器

os-copilot安装与多项功能测评，帮助开发人员PHP环境排查问题

Python3虚拟环境venv

相关课程

更多

机器学习基础与回归算法

神经网络概览及算法详解

机器学习集成学习与模型融合

场景实践 - 基于阿里云PAI机器学习平台使用时间序列分解模型预测商品销量

南瓜书《机器学习公式推导》

【医学搜索Query相关性判断】赛题及baseline解读

相关电子书

更多

纯干货|机器学习中梯度下降法的分类及对比分析

纯干货 | 机器学习中梯度下降法的分类及对比分析

优势特征蒸馏(Privileged Features Distillation)在手淘信息流推荐中的应用

相关实验场景

更多

如何快速训练大模型

推荐系统入门之使用ALS算法实现打分预测

下一篇

阿里云oss简介和如何对接使用