Re30：读论文 LegalGNN: Legal Information Enhanced Graph Neural Network for Recommendation

2022-10-23 260 发布于内蒙古

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： Re30：读论文 LegalGNN: Legal Information Enhanced Graph Neural Network for Recommendation

1. Background & Motivation

Legal-Rec和传统推荐系统的区别：

法律信息的结构联系和文本内容都很重要，因此特征融合很重要。
用户偏向于新案例（最新司法解释和司法实践），因此新item问题严重。
用户关注少数主题、兴趣稳定，所以准确建模用户兴趣很重要。

本文认为：

传统在图中传播节点特征的方法对结构联系的应用不够充分。
传统解决new-item的方法是基于内容，没有考虑与之前有充分交互信息的item的关系。本文用法律概念作为这个桥梁。

以前的Legal-Rec工作主要考虑多主题内容和冗余关系，因此使用基于主题模型的方法（如LDA）或基于图的方法。但这忽略了法律信息的联系。基于图的方法还丢失了法律文书的内容信息。

以前有用法律知识图谱做IR或QA的工作。

传统仅使用内容的推荐系统缺失结构信息，使用知识图谱的推荐系统（KG+user-item二部图）缺乏对知识图谱节点内容的应用（利用节点内容特征不够充分）。

2. LegalGNN

2.1 HLIN

节点：users, cases, queries, legal concepts, and connections among them

法律概念包括：cause, law, clause, and factor

特征：文本

边（建模用户兴趣）：user-query and item-query relationships

User-item Interaction History

Search History

legal knowledge graph

Legal Domain Knowledge（作为side information）：文本法律概念和其间的结构化联系。

结构化联系包括：

item-entity alignments（案例与法律概念相关）
法律概念之间的联系（层级化定义）

有向图，但是每种关系同时考虑其反向关系

user behavior graph

interaction：user & item

submit：user & query

retrieval：query & item

2.2 LegalGNN

BERT+SDAE+TransR+GNN

Unified Content and Structure Representation Module

图基本上就是上一节的构图内容

BERT（OpenCLaP的预训练模型，最后一层嵌入token的平均池化）

降维：autoencoder (SDAE)

Denoising Autoencoder (DAE)

两层SDAE：

以上两个模块与下游任务解耦

Unified Node Representation：TransR+与固定的文本内容向量（经线性变换后）concat

两种嵌入都随机初始化后梯度下降（我没太搞懂为什么，难道不是前面得到的吗？而且我确实觉得已经有GNN了还要显式建模一下结构，很奇怪）

通过随机corrupt构建负三元组

Multi-relational GNN Module

本文参考LightGCN构建了简化版的GNN模型。

GNN：pool + aggregate（直接对每种关系的邻居做一个整体的池化，然后再用attention进行聚合。不使用transformation矩阵：避免过拟合问题）

propagation：

Relational Attention

注意力计算方式：

Prediction：内积

pair-wise ranking loss：

（对每一个训练集样本，随机选择一个负样本）

模型训练

用SDAE降维：
联合学习推荐任务和表示任务：
按推荐任务等比例抽取图中的mini-batch进行训练；类似GraphSAGE的抽样策略

Leakage Path Bias during Graph Modeling

break-path strategy

3. 实验

3.1 数据集

大型法律推荐数据集。由于隐私问题不能完全公开。

划分数据集：leave-one-out strategy（用每个用户最新交互作为测试集，倒数第二次交互作为验证集，其他作为训练集）

不考虑重复推荐问题

negative sampling method：评估排序任务中的推荐表现（1-99）

（注意表格中只有一个方向的关系，事实上反向边也考虑）

3.2 baseline

基于因式分解：BPR
基于GNN

KGAT

LightGCN

基于HIN

CFKG

GATNE-T

GATNE-I

基于内容

ACCM

NFM

NRMS

NRHUB

3.3 实验设置

PyTorch

重复5次实验（只有随机种子改变）

其他略

3.4 主实验结果

评估指标：

Hit Ratio (HR)

Normalized Discounted Cumulative Gain (NDCG)

3.5 模型分析

3.5.1 Ablation Study

C：文本内容特征

S：结构特征

Debias：训练过程中的debias strategy

Q：query节点及其相关边

Re30：读论文 LegalGNN: Legal Information Enhanced Graph Neural Network for Recommendation

1. Background & Motivation

2. LegalGNN

2.1 HLIN

2.2 LegalGNN

3. 实验

3.1 数据集

3.2 baseline

3.3 实验设置

3.4 主实验结果

3.5 模型分析

3.5.1 Ablation Study

3.5.2 冷启动问题

3.5.3 超参设置

3.5.4 案例分析

热门文章

最新文章

相关电子书

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

开发者评测

高校计划

乘风者计划

训练营

阿里云MVP

话题

直播

下载

镜像站

技术资料

插件

Re30：读论文 LegalGNN: Legal Information Enhanced Graph Neural Network for Recommendation

1. Background & Motivation

2. LegalGNN

2.1 HLIN

2.2 LegalGNN

3. 实验

3.1 数据集

3.2 baseline

3.3 实验设置

3.4 主实验结果

3.5 模型分析

3.5.1 Ablation Study

3.5.2 冷启动问题

3.5.3 超参设置

3.5.4 案例分析

热门文章

最新文章

相关电子书