元图:通过元学习进行小样本的链接预测

简介: 元图:通过元学习进行小样本的链接预测

image.png

今天给大家介绍McGill University和Uber AI一起在 NeurIPS 2020发表的一篇关于元学习的论文。该论文针对目前链接预测的方法不能够在多图的情况下有效的传递、利用图中的信息,以及不能从稀疏图中有效的学习这两个问题,提出了一个基于梯度下降的元学习框架——Meta-Graph。实验结果显示,对于多图和稀疏图的情况而言,MetaGraph相比于现有的模型有更好的效果。


1


简介


常见的深度学习模型,目的是学习一个用于预测的数学模型。而元学习面向的不是学习的结果,而是学习的过程。其学习的不是一个直接用于预测的数学模型,而是学习“如何更快更好地学习一个数学模型”,简单来说就是学习如何学习。


对于一个有着结点和边的表示的图,链接预测的目的是去学习这个图,然后推断结点之间目前未知的边,以达到预测的目的。例如在社交网络中,我们可以使用链接预测来增强友谊推荐系统,或者在生物网络数据的情况下,利用链接预测来推断药物,蛋白质,疾病之间可能的关系。


目前的主流的链接预测方法的一个特点就是,这些工作通常指关注一个特定的问题设置:它通常假定链接预测将在单个大图上执行,并且该图相对完整。而在这项工作中,作者希望可以通过元学习,从多个图(每个图仅仅包含完整图的小部分数据)上进行链接预测。


2


主要贡献


Meta-Graph是基于梯度下降的元学习方法。作者把图上的分布看作是任务的分布(也就是一幅图看成是一个任务。多个任务组成我们拥有的全部数据),对于每一个任务,使用的模型是可以进行few-shot链接预测的图神经网络VAGE。从不同的任务中可以学习到一组全局初始化参数。


为了使得模型更加迅速的适应新的任务,还引入了图签名函数(Graph signature function),用于将每个图的结构映射成为VAGE的初始输入:。


利用全局初始化参数和图签名函数来初始化VGAE的推理模型。该论文的模型框架如下图右图所示,左图为MAML模型与Meta-Graph模型的对比:

image.png

Meta-Graph 背后关键的思想是,使用基于梯度的元学习来优化VGAE推理模型中的全局初始化参数,同时还学习了调制图形中参数初始化的编码函数。通过不同的任务不断去完善全局初始化参数和图签名函数,最后可以利用这两个组件,在新的任务上实现更加优异的表现。主要的算法如下图所示:

image.png

3


实验


作者设计了三种新颖的基准测试,以实现few-shot链接预测任务。


3.1、模型表现 对于每个图,只选取其部分边以及边所对应的结点(作者设置了取10%,20%,30%三种情况),以构造出稀疏图。下图展示了该模型在不同程度的稀疏图下的平均AUC表现。总体而言,Meta-Graph在除了一种设置外的其他所有设置中均实现了最高的平均AUC。与经典的基于梯度下降的元学习方法MAML相比较,平均AUC提高了4.8%,与Finetune基准相比,则提高了5.3%。值得一提的是,对于每个图,仅使用10%的图边缘进行训练时,Meta-Graph表现出特别强劲的性能,这突出了作者的框架可以从稀疏图中有效的学习。

image.png

3.2、新任务的适应性 下图展示了通过Meta-Graph,在一组稀疏图训练数据中,仅执行5次梯度更新后的平均AUC。可以看到,Meta-Graph的性能与MAML相比提高了9.4%,和Finetune相比平均提高了8.0%。这突出显示了,图不仅仅可以从稀疏的边缘样本中学习,而且还可以仅使用少量的梯度步骤就可以快速学习新的数据。

image.png

4


讨论


作者设计了Meta-Graph框架来解决few-shot链接预测的问题。该框架采用基于梯度的元学习来优化局部链接预测模型的全局初始化参数,同时还学习每个图的编码函数(图签名函数)。根据实验结果可以知道,在三个截然不用的基线任务上,Meta-Graph取得了比较好的表现。就该方法的局限性而言,作者认为一个关键的局限性是图形签名函数仅限于通过当前图形的编码来调制本地链接预测模型,而该图形并未明确捕获数据集中图形之间的成对相似性。可以通过学习图之间的相似性度量或者内核来拓展原图,然后将其用于条件元学习。


目录
相关文章
|
4月前
|
人工智能 自然语言处理 数据安全/隐私保护
OpenClaw Skills是什么?王炸组合 OpenClaw+Skills 安装、场景实战+阿里云部署攻略
OpenClaw作为2026年现象级开源AI智能体,凭借本地运行、全权限实操的核心优势,已成为个人与团队提升效率的利器。而Skills(技能插件)作为OpenClaw的“能力扩展手脚”,更是让其从“智能聊天助手”升级为“全能数字员工”——通过安装不同场景的Skills,可轻松实现网页自动化、邮件管理、PDF编辑、信息检索等复杂操作,覆盖办公、开发、生活全场景。
3414 4
|
9月前
|
人工智能 缓存 安全
阿里云发布《AI 原生应用架构白皮书》
阿里云联合阿里巴巴爱橙科技,共同发布《AI 原生应用架构白皮书》,围绕 AI 原生应用的 DevOps 全生命周期,从架构设计、技术选型、工程实践到运维优化,对概念和重难点进行系统的拆解,并尝试提供一些解题思路。白皮书覆盖 AI 原生应用的 11 大关键要素,获得 15 位业界专家联名推荐,来自 40 多位一线工程师实践心的,全书合计超 20w 字,分为 11 章。
4095 81
|
机器学习/深度学习 PyTorch 调度
内部干货 | 基于华为昇腾910B算力卡的大模型部署和调优-课程讲义
近日上海,TsingtaoAI为某央企智算中心交付华为昇腾910B算力卡的大模型部署和调优课程。课程深入讲解如何在昇腾NPU上高效地训练、调优和部署PyTorch与Transformer模型,并结合实际应用场景,探索如何优化和迁移模型至昇腾NPU平台。课程涵盖从模型预训练、微调、推理与评估,到性能对比、算子适配、模型调优等一系列关键技术,帮助学员深入理解昇腾NPU的优势及其与主流深度学习框架(如PyTorch、Deepspeed、MindSpore)的结合应用。
6105 13
|
并行计算 PyTorch Linux
大概率(5重方法)解决RuntimeError: CUDA out of memory. Tried to allocate ... MiB
大概率(5重方法)解决RuntimeError: CUDA out of memory. Tried to allocate ... MiB
13296 0
|
Web App开发 前端开发 数据可视化
20K star!让网页设计秒变手绘风,这个开源库太有创意了!
嗨,大家好,我是小华同学。Rough.js 是一个仅8KB的轻量级图形库,能为网页元素赋予自然的手绘质感,支持手绘风格渲染、全类型图形和跨平台兼容。它适合数据可视化、教育课件、原型设计等场景,具有设计友好、性能卓越、扩展性强等优势。
723 12
|
人工智能 算法 芯片
天天都在说的“算力”到底是个啥?一文全讲透!
算力是数字经济发展的重要支撑,尤其在AI和大数据应用中起着关键作用。阿里云致力于构建全球领先的算力基础设施,助力各行业数字化转型。吴泳铭和马云均强调了算力在未来科技竞争中的核心地位。2023年底,我国算力总规模达230EFLOPS,位居全球第二。算力分为通用、智能和超算算力,广泛应用于人工智能训练与推理等场景。中国正加速建设智算中心,推动算力产业链发展,并注重绿色低碳和智能运维,以应对日益增长的计算需求。
25201 19
|
机器学习/深度学习 编解码 测试技术
TimeMOE: 使用稀疏模型实现更大更好的时间序列预测
TimeMOE是一种新型的时间序列预测基础模型,通过稀疏混合专家(MOE)设计,在提高模型能力的同时降低了计算成本。它可以在多种时间尺度上进行预测,并且经过大规模预训练,具备出色的泛化能力。TimeMOE不仅在准确性上超越了现有模型,还在计算效率和灵活性方面表现出色,适用于各种预测任务。该模型已扩展至数十亿参数,展现了时间序列领域的缩放定律。研究结果显示,TimeMOE在多个基准测试中显著优于其他模型,特别是在零样本学习场景下。
2219 64
|
人工智能 搜索推荐 程序员
用 Go 语言轻松构建 MCP 客户端与服务器
本文介绍了如何使用 mcp-go 构建一个完整的 MCP 应用,包括服务端和客户端两部分。 - 服务端支持注册工具(Tool)、资源(Resource)和提示词(Prompt),并可通过 stdio 或 sse 模式对外提供服务; - 客户端通过 stdio 连接服务器,支持初始化、列出服务内容、调用远程工具等操作。
2954 5
|
机器学习/深度学习
【元学习meta-learning】通俗易懂讲解元学习以及与监督学习的区别
本文通过通俗易懂的方式解释了元学习(Meta-learning)的概念及其与传统监督学习的区别,并通过实例说明了元学习是如何让模型具备快速学习新任务的能力。
4346 0