备案控制台

开发者社区人工智能文章正文

Re9：读论文 DEAL Inductive Link Prediction for Nodes Having Only Attribute Information

2022-10-22 241

版权

举报

版权声明：

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： Re9：读论文 DEAL Inductive Link Prediction for Nodes Having Only Attribute Information

1. Background & Motivation

早期链路预测任务关注节点相似性的度量，近年来往往通过图嵌入方法来实现链路预测。有些图嵌入方法只能捕获图结构信息，能捕获attributes信息的大多关注transductive范式（两个节点都在训练时就存在于图中）。

可以做inductive链路预测，但是需要边的模型：SDNE3（只能捕获图结构信息）和GraphSAGE4。

G2G5：可以对没有局部结构的新节点做inductive链路预测，但无法区分特征相似的节点，因为它无法很好地捕获节点表征中体现的结构信息。

2. DEAL模型

在视频中的画法，换了个方向：

2.1 Attribute-oriented Encoder

输入是节点attributes，输出节点嵌入：

可以选择各种神经网络，本文直接用了MLP（激活函数是ELU）：

（这里论文对没用GCN的解释是：经实验观察，聚合太多邻居信息会影响attributes表征效果。我的迷惑点在于，这他妈的在inductive场景下不是不能用GCN吗！）

2.2 Structure-oriented Encoder

用节点独热编码作为输入，得到节点嵌入：

就是说这个本来也可以用GCN（以邻接矩阵为输入），但是实验证明效果不如本文提出的方法。

2.3 对齐机制和模型训练

模型训练时2个encoder一起更新参数，在向量空间对齐表征。

2.3.1 损失函数

ranking-motivated loss（证明其效果的参考文献：5和Content-based citation recommendation）

本文提出了一个新的mini-batch learning method with a personalized ranking-motivated loss

contrastive loss6：

（公式中p-q是成对样本，共有k对）

直接使用contrastive loss的问题是：1. 负样本对距离不同，因此用同一个margin（τ ）不合适。2. 损失函数中没有考虑regularization。

2.3.2 对齐机制

最小化2个encoder的上述损失函数，然后加上对齐机制。

Tight Alignment (T-align)：最小化节点的2种表征（太严格了）
Loose Alignment (L-align)：最大化相连节点的不同表征（就是一个结构、一个attributes）的相似性（用和2.3.1部分介绍的一样的损失函数来做）

最后就是两个链路预测的损失，加对齐的损失：

2.3.3 训练算法和预测过程

测试时：

3. 实验

3.1 数据集

细节略

3.2 baseline

MLP

SEAL

G2G5

GAE

细节略

3.3 实验设置

略。

3.4 主实验结果

论文里也没说这个Cite.是啥模型。

3.5 模型分析

细节略，待补。

4. 代码复现

等我服务器好了再说。

文章标签：

机器学习/深度学习

算法

诸神缄默不语

目录

相关文章

INSVAST

|

1月前

|

算法数据挖掘

文献解读-Prediction of axillary lymph node metastasis in triple-negative breast cancer by multi-omics analysis and an integrated model

研究旨在为三阴性乳腺癌患者提供更准确的腋窝淋巴结转移风险评估工具。研究者综合分析了临床病理信息、基因组和转录组数据，构建了一个多组学预测模型。

INSVAST

34 4 6

INSVAST

|

5月前

|

算法数据挖掘

文献解读-Consistency and reproducibility of large panel next-generation sequencing: Multi-laboratory assessment of somatic mutation detection on reference materials with mismatch repair and proofreading deficiency

Consistency and reproducibility of large panel next-generation sequencing: Multi-laboratory assessment of somatic mutation detection on reference materials with mismatch repair and proofreading deficiency，大panel二代测序的一致性和重复性：对具有错配修复和校对缺陷的参考物质进行体细胞突变检测的多实验室评估

INSVAST

50 6 6

文献解读-Consistency and reproducibility of large panel next-generation sequencing: Multi-laboratory assessment of somatic mutation detection on reference materials with mismatch repair and proofreading deficiency

Trouble..

|

算法计算机视觉知识图谱

ACL2022：A Simple yet Effective Relation Information Guided Approach for Few-Shot Relation Extraction

少样本关系提取旨在通过在每个关系中使用几个标记的例子进行训练来预测句子中一对实体的关系。最近的一些工作引入了关系信息

Trouble..

147 0 0

Trouble..

|

存储机器学习/深度学习人工智能

PTPCG: Efficient Document-level Event Extraction via Pseudo-Trigger-aware Pruned Complete Graph论文解读

据我们所知，我们目前的方法是第一项研究在DEE中使用某些论元作为伪触发词的效果的工作，我们设计了一个指标来帮助自动选择一组伪触发词。此外，这种度量也可用于度量DEE中带标注触发词的质量。

Trouble..

146 1 1

Trouble..

|

机器学习/深度学习移动开发自然语言处理

DEPPN：Document-level Event Extraction via Parallel Prediction Networks 论文解读

当在整个文档中描述事件时，文档级事件抽取（DEE）是必不可少的。我们认为，句子级抽取器不适合DEE任务，其中事件论元总是分散在句子中

Trouble..

154 0 0

DEPPN：Document-level Event Extraction via Parallel Prediction Networks 论文解读

Trouble..

|

机器学习/深度学习数据挖掘

ACL2023 - An AMR-based Link Prediction Approach for Document-level Event Argument Extraction

最近的工作引入了用于文档级事件论元提取（文档级EAE）的抽象语义表示（AMR），因为AMR提供了对复杂语义结构的有用解释，并有助于捕获长距离依赖关系

Trouble..

224 0 0

Trouble..

|

机器学习/深度学习自然语言处理算法

Joint Information Extraction with Cross-Task and Cross-Instance High-Order Modeling 论文解读

先前的信息抽取(IE)工作通常独立地预测不同的任务和实例(例如，事件触发词、实体、角色、关系)，而忽略了它们的相互作用，导致模型效率低下。

Trouble..

113 0 0

Trouble..

|

自然语言处理 Java 计算机视觉

ACL2023 - AMPERE: AMR-Aware Prefix for Generation-Based Event Argument Extraction Model

事件论元抽取（EAE）识别给定事件的事件论元及其特定角色。最近在基于生成的EAE模型方面取得的进展显示出了与基于分类的模型相比的良好性能和可推广性

Trouble..

230 0 0

Trouble..

|

机器学习/深度学习自然语言处理算法

TPLinker: Single-stage Joint Extraction of Entities and Relations Through Token Pair Linking 论文解读

近年来，从非结构化文本中提取实体和关系引起了越来越多的关注，但由于识别共享实体的重叠关系存在内在困难，因此仍然具有挑战性。先前的研究表明，联合学习可以显著提高性能。然而，它们通常涉及连续的相互关联的步骤，并存在暴露偏差的问题。

Trouble..

242 0 0

Trouble..

|

机器学习/深度学习自然语言处理索引

GTEE-DYNPREF: Dynamic Prefix-Tuning for Generative Template-based Event Extraction 论文解读

我们以基于模板的条件生成的生成方式考虑事件抽取。尽管将事件抽取任务转换为带有提示的序列生成问题的趋势正在上升，但这些基于生成的方法存在两个重大挑战

Trouble..

171 0 0

热门文章

最新文章

6亿数据秒级查询，ClickHouse太快了！

Unsafe工具类 | 带你学《Java语言高级特性》之八十八

用模拟器加载基于ARM平台的WinCE6.0 内核（NK.bin）

Windows新0day漏洞可穿透UAC

Java 多线程之 Runnable

微信将整顿多级分销欺诈行为严重者将永久封号

独家 | Face++印奇：AI是场持久战，但第一阶段明年结束

给文档库添加项目级权限控制

python中if __name__ == '__main__': 的解析

《UNIX网络编程》中第一个timer_server的例子

Dpkg软件包管理工具使用指南

RPM软件包管理工具使用指南

Apt软件包管理工具使用指南

Yum与Dnf软件包管理器使用指南

图解MySQL【日志】——Redo Log

Linux软件包管理工具概览

基于扩频解扩+turbo译码的16QAM图传通信系统matlab误码率仿真,扩频参数可设置

通过MATLAB实现PID控制器,积分分离控制器以及滑模控制器

基于Itô扩散过程的交易策略偏微分方程matlab求解与仿真

draw.io：开源款白板/图表绘制利器

相关电子书

更多

Fighting Cybercrime: A Joint Task Force of Real-Time Data and Human Analytics

Big Data-Based Fraud Detection

Needle in the Haystack—User Behavior Anomaly Detection for Information Security

下一篇

阿里云oss简介和如何对接使用

目录

目录