备案控制台

开发者社区人工智能文章正文

Re21：读论文 MSJudge Legal Judgment Prediction with Multi-Stage Case Representation Learning in the Real

2022-10-23 186

版权

版权声明：

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： Re21：读论文 MSJudge Legal Judgment Prediction with Multi-Stage Case Representation Learning in the Real

1. Background

case life-cycle information

难点：

不同角色的词汇空间可能都不一样，传统NLP算法很难整（consume）这个。
当事人陈述与最后判决识别的事实之间的gap。

2. 模型MSJudge

多任务

MSJudge：同时从court debate中识别legal facts和预测每个claim的judgment result

（这里面的抽取的事实部分我是有点好奇，可以用最后判决书里的事实描述文本来做teacher forcing吗？）

可视化components（ “debate and fact”, “fact and claim” and “across claims”）之间的互相影响

Multi-Stage Context Encoding：模仿法官理解court debate和pre-trial claims

Debate Utterance Encoder：word embedding + role embedding（随机初始化，联合训练）→Bi-LSTM+attention→utterance embedding

Debate Dialogue encoder：Bi-LSTM，建模得到utterance的全局表征

Pre-trial Claim Encoder：Bi-LSTM+attention（debate和claim共享词嵌入矩阵）

Multi-Stage Content Interaction：建模debates和claims、facts和claims、claims之间的关联，加强claim表征

Debate-to-Claim

Debate-to-Fact

Fact-to-Claim

Fusion

Across-Claim

Fact Recognition and Judgment Prediction

3. 实验

word embeddings (skip-gram) and role embeddings维度：300

Bi-LSTM隐藏层维度：256

Adam 学习率0.001

batch size 16

dropout rate 0.8

grid search tuning method and cross-validation
把每个claim加上所有debate然后做预测

其他略，待补。

文章标签：

自然语言处理

数据可视化

算法

诸神缄默不语

目录

相关文章

征途黯然。

|

数据挖掘

【提示学习】Automatic Multi-Label Prompting: Simple and Interpretable Few-Shot Classification

文章提出了一种简单确高效地构建verbalization的方法：

征途黯然。

55 0 0

征途黯然。

|

数据挖掘

【提示学习】Prompt Tuning for Multi-Label Text Classification: How to Link Exercises to Knowledge Concept

文章这里使用的是BCEWithLogitsLoss，它适用于多标签分类。即：把[MASK]位置预测到的词表的值进行sigmoid，取指定阈值以上的标签，然后算损失。

征途黯然。

70 0 0

Trouble..

|

机器学习/深度学习自然语言处理数据挖掘

UnifiedEAE: A Multi-Format Transfer Learning Model for Event Argument Extraction via Variational论文解读

事件论元抽取(Event argument extraction, EAE)旨在从文本中抽取具有特定角色的论元，在自然语言处理中已被广泛研究。

Trouble..

88 0 0

Trouble..

|

数据挖掘

MUSIED: A Benchmark for Event Detection from Multi-Source Heterogeneous Informal Texts 论文解读

事件检测（ED）从非结构化文本中识别和分类事件触发词，作为信息抽取的基本任务。尽管在过去几年中取得了显著进展

Trouble..

66 0 0

Trouble..

|

机器学习/深度学习自然语言处理算法

Joint Information Extraction with Cross-Task and Cross-Instance High-Order Modeling 论文解读

先前的信息抽取(IE)工作通常独立地预测不同的任务和实例(例如，事件触发词、实体、角色、关系)，而忽略了它们的相互作用，导致模型效率低下。

Trouble..

95 0 0

Trouble..

|

机器学习/深度学习存储数据挖掘

Global Constraints with Prompting for Zero-Shot Event Argument Classification 论文解读

确定事件论元的角色是事件抽取的关键子任务。大多数以前的监督模型都利用了昂贵的标注，这对于开放域应用程序是不实际的。

Trouble..

72 0 0

Trouble..

|

机器学习/深度学习自然语言处理算法

TPLinker: Single-stage Joint Extraction of Entities and Relations Through Token Pair Linking 论文解读

近年来，从非结构化文本中提取实体和关系引起了越来越多的关注，但由于识别共享实体的重叠关系存在内在困难，因此仍然具有挑战性。先前的研究表明，联合学习可以显著提高性能。然而，它们通常涉及连续的相互关联的步骤，并存在暴露偏差的问题。

Trouble..

216 0 0

Trouble..

|

自然语言处理算法知识图谱

DEGREE: A Data-Efficient Generation-Based Event Extraction Model论文解读

事件抽取需要专家进行高质量的人工标注，这通常很昂贵。因此，学习一个仅用少数标记示例就能训练的数据高效事件抽取模型已成为一个至关重要的挑战。

Trouble..

152 0 0

征途黯然。

|

机器学习/深度学习算法数据挖掘

【多标签文本分类】Improved Neural Network-based Multi-label Classification with Better Initialization ……

【多标签文本分类】Improved Neural Network-based Multi-label Classification with Better Initialization ……

征途黯然。

127 0 0

【多标签文本分类】Improved Neural Network-based Multi-label Classification with Better Initialization ……

auqbllxiu

《Investigation of Transformer based Spelling Correction Model for CTC-based End-to-End Mandarin Speech Recognition》电子版地址

Investigation of Transformer based Spelling Correction Model for CTC-based End-to-End Mandarin Speech Recognition

auqbllxiu

95 0 0

《Investigation of Transformer based Spelling Correction Model for CTC-based End-to-End Mandarin Speech Recognition》电子版地址

热门文章

最新文章

会声会影2023视频编辑软件免费序列号永久

苹果电脑 Mac OS X 系统上防止误按 command+Q 退出软件

Flutter之禅内存优化篇

用户密码以BCrypt加密的方式来防范被破解

java Redis工具类

XP注册表优化工具箱

CV和Resume的区别（转）

两名在校生的问题

【AIX 学习】网络管理

通义灵码的代码安全增强措施

国外地区经纬度查询免费API接口教程

《C++文件操作新境界：随机访问与映射的高效实现秘籍》

《C++ 网络编程：高效实现 TCP/IP 与 UDP 通信》

全国行政区划查询免费API接口教程

全国行政区划代码与经纬度查询免费API接口教程

Web应用防火墙（WAF）与数据库应用防火墙有什么区别？

服务器最大支持多少链接数

国家名称大全免费API接口教程

相关电子书

更多

Identify Disease-Causal Genes from GWAS Loci by 3D Genomics Structure,Regulatory Landscapes and Deep Learning

Investigation of Transformer based Spelling Correction Model for CTC-based End-to-End Mandarin Speech Recognition

Autoencoder-based Semi-Supervised Curriculum Learning For Out-of-domain Speaker Verification

下一篇

阿里云OSS设置跨域访问