JOAO:自动化选择数据增强的GraphCL

简介: JOAO:自动化选择数据增强的GraphCL

论文标题:Graph Contrastive Learning Automated


论文链接:https://arxiv.org/abs/2106.07594


论文来源:ICML 2021


之前的相关博客:GraphCL:基于数据增强的图对比学习


一、概述


与图片数据不同,图数据来源于多个不同的领域,不同来源的图数据性质差异很大,因此在进行数据增强时不同的数据集可能会适应不同的方式。在GraphCL中采用了多种不同的数据增强方式,但是对于具体的数据集来说需要通过手工挑选特定的增强方式。数据增强方式的选择遵循经验法则,通常是从每个数据集的反复试验中总结出来的。对于这个问题,本文提出了 JOint Augmentation Optimization (JOAO)框架来进行数据增强方式的自动选择。JOAO是一个基于对抗方式的min-max双层训练框架,其特点是:

①自动的,完全不需要人工选择数据增强的方式;

②自适应的,平滑泛化处理不同的图数据;

③动态的,允许在不同的训练阶段选用不同的数据增强。

另外需要强调两点:

①JOAO不一定要与GraphCL绑定,也可以与其他图对比学习框架结合;

②JOAO主要关注数据增强方式的自动化选择,其目标是能够达到SOTA的效果,而不一定要超越它。


二、方法


  1. GraphCL


QQ截图20220612082818.png

                                                   GraphCL

QQ截图20220612082912.png

QQ截图20220612083034.png


  1. JOAO


  • 框架


QQ截图20220612083120.png


JOAO受对抗训练的启发,采用交替梯度下降的min-max优化框架,始终利用当前对比损失的最具挑战性的数据增强:


QQ截图20220612083219.png

QQ截图20220612083253.png

                                                     算法

  • 上层优化

QQ截图20220612083333.png

QQ截图20220612083505.png

那么现在下层优化的形式为:

QQ截图20220612083724.png

  • JOAO中的多映射头

QQ截图20220612083811.png

                                                   JOAOv2

损失函数为:

QQ截图20220612083853.png

三、实验


  1. JOAO与GraphCL手工选择的对比


下图对比了GraphCL论文中实验结果与JOAO选择的结果:


QQ截图20220612083929.png

                                                     对比

  1. 半监督学习


半监督学习实验:


QQ截图20220612084009.png

                                                     半监督学习

  1. 无监督学习


无监督学习实验:


QQ截图20220612084048.png

                                                     无监督学习

  1. 迁移学习


迁移学习实验:

QQ截图20220612084127.png

                                                         迁移学习

  1. 大规模数据集


半监督大规模数据集实验:


QQ截图20220612084253.png

                                                大规模数据及

  1. 总体实验结果


QQ截图20220612084335.png

                                                         实验




相关文章
|
6天前
|
数据采集 存储 API
网络爬虫与数据采集:使用Python自动化获取网页数据
【4月更文挑战第12天】本文介绍了Python网络爬虫的基础知识,包括网络爬虫概念(请求网页、解析、存储数据和处理异常)和Python常用的爬虫库requests(发送HTTP请求)与BeautifulSoup(解析HTML)。通过基本流程示例展示了如何导入库、发送请求、解析网页、提取数据、存储数据及处理异常。还提到了Python爬虫的实际应用,如获取新闻数据和商品信息。
|
6天前
|
数据采集 数据可视化 数据处理
【办公自动化】在Excel中按条件筛选数据并存入新的表2.0
【办公自动化】在Excel中按条件筛选数据并存入新的表2.0
56 1
|
6天前
|
前端开发 JavaScript Java
用Python实现高效数据记录!Web自动化技术助你告别重复劳动!
用Python实现高效数据记录!Web自动化技术助你告别重复劳动!
33 1
|
6天前
|
JSON 监控 数据管理
【Elasticsearch专栏 12】深入探索:Elasticsearch使用索引生命周期管理(ILM)自动化删除旧数据
Elasticsearch的ILM功能允许用户定义策略,自动管理索引从创建到删除的生命周期。用户可以设置策略,根据索引年龄或大小自动删除旧数据,节省存储空间。通过应用ILM策略于索引模板,新索引将遵循预定义的生命周期。用户还可以监控ILM状态,确保策略按预期执行。使用ILM,用户可以高效地管理数据,确保旧数据及时删除,同时保持数据完整性和安全性。
81 3
|
6天前
|
存储 自然语言处理 数据可视化
【办公自动化】用Python按时间分割txt文件中的数据
【办公自动化】用Python按时间分割txt文件中的数据
63 1
|
6天前
|
敏捷开发
【sgCreateTableData】自定义小工具:敏捷开发→自动化生成表格数据数组[基于el-table]
【sgCreateTableData】自定义小工具:敏捷开发→自动化生成表格数据数组[基于el-table]
|
6天前
|
数据挖掘 数据处理 Python
使用Python自动化处理Excel数据
【2月更文挑战第4天】在现代社会,数据处理已经成为了一项重要的任务。而Excel作为一款广泛应用于数据处理的软件,已经成为了许多人的首选。不过,对于大规模的数据处理任务,手动进行Excel操作可能是低效的。本文将介绍如何使用Python编程语言来自动化处理Excel数据。
62 9
|
8月前
|
数据采集 存储 安全
利用爬虫技术自动化采集汽车之家的车型参数数据
汽车之家是一个专业的汽车网站,提供了丰富的汽车信息,包括车型参数、图片、视频、评测、报价等。如果我们想要获取这些信息,我们可以通过浏览器手动访问网站,或者利用爬虫技术自动化采集数据。本文将介绍如何使用Python编写一个简单的爬虫程序,实现对汽车之家的车型参数数据的自动化采集,并使用亿牛云爬虫代理服务来提高爬虫的稳定性和效率。
388 0
利用爬虫技术自动化采集汽车之家的车型参数数据
|
6天前
|
数据采集 数据可视化 数据处理
【办公自动化】在Excel中按条件筛选数据并存入新的表
【办公自动化】在Excel中按条件筛选数据并存入新的表
42 0
|
6天前
|
存储 数据挖掘 数据库
【办公自动化】使用Python一键往Word文档的表格中填写数据
【办公自动化】使用Python一键往Word文档的表格中填写数据
66 1

热门文章

最新文章