Re24:读论文 IOT-Match Explainable Legal Case Matching via Inverse Optimal Transport-based Rationale Ext

简介: Re24:读论文 IOT-Match Explainable Legal Case Matching via Inverse Optimal Transport-based Rationale Ext

1. Background


计算最优运输准备以后慢慢看的参考资料:

  1. 优化 | 计算最优传输(Computational Optimal Transport) - 知乎
  2. 运筹千里纵横论坛|王祥丰:计算最优传输及其应用浅谈_哔哩哔哩_bilibili
  3. The Book - Computational Optimal Transport
  4. 数值优化与分布式优化 - 知乎


法律案例匹配关注识别成对法律案例之间的关系。这对普通法系和民法系的判案决策都有参考价值。

现存方法有基于PCNet1和基于Bert2的,这些方法的问题在于无法对匹配结果提供有说服力的、忠实的解释。

在篇幅长的法律文书中,只有rationales表征支持匹配结果的legal characteristics和对应的解释。但现存方法会忽略rationales和其他句子的角色差异。

此外,理想的解释还需要正负两方面的理由。但现存各领域的rationales抽取方法都不能实现这一点。

最后,标记解释(不同案例的对齐rationales)昂贵、稀疏、有偏(仅正确标记少量正样本对,存在海量负样本对)。因此有监督方法往往会导致次优匹配结果和不可靠的解释。

image.png

IOT-Match将正负rationales的抽取和匹配视作最优运输问题,由一个反应跨案例句子之间语义和legal characteristic关系的、可学习的affinity matrix来指导,这个affinity matrix由逆向最优运输过程学习,即需解决一个bi-level optimization problem。这样,IOT-Match学习直接抽取正负rationales。然后将抽取出的rationales输入预训练模型生成匹配结果的label-specific自然语言解释。为了去除噪声句并对正负理由赋权,最终匹配结果基于抽取出的rationales和label-specific解释生成。

related work部分包含法律案例匹配和legalAI可解释性两部分,细节待补。


2. 问题定义与模型构建


2.1 问题定义

每对标注数据包含:

image.png


示例:

image.png

可解释的法律案例匹配:①抽取对齐和非对齐的rationales。②从中抽取出候选解释。③生成最终匹配标签和解释。


2.2 模型原理

因为最优运输这块我完全不懂,所以论文说啥我就当是啥了:

给出两个句子表征集合(X 和Y ),我们假设其实证分布是uniform的:

image.png

离散地计算最优运输距离……底下的没看懂,懒得粘了,以后看懂了再说吧。


2.3 IOT-based Rationale Extraction

image.png


2.4 Generating Candidate Explanations


3. 实验


实验目标是:

  1. 超过带解释的法律案例匹配和文本匹配的SOTA模型的匹配准确度
  2. 解释(包括抽取的rationales和生成自然语言)效果
  3. 利用有限的rationale alignment labels

以下细节待补。


3.1 数据集ELAM&eCAIL

image.png


3.2 baseline

无解释的:

  • Sentence-Bert
  • lawformer
  • BERT-PLI
  • Thematic Similarity

带解释的:

  • NILE
  • LIREx

rationale extraction:

  • MT-H-LSTM
  • MLMC
  • DecAtt


3.3 实验设置


3.4 主实验结果

image.png

image.png

image.png


3.5 实验分析


3.5.1 Ablation Study

image.png

image.png


3.5.2 Case Study

image.png

image.png

image.png


4. 代码复现


等我服务器好了再说。

相关文章
|
XML Java 数据库连接
Mybatis的mapper.xml 映射文件没有提示?
1、先来看一下Mapper.xml的头文件 ——1-1、从标文件中可以看到标黄的是Mapper.xml的命名空间,不提示就是该网络的地址获取不到信息 或 没有配置目录的mybatis-3-mapper.dtd
Mybatis的mapper.xml 映射文件没有提示?
|
机器学习/深度学习 算法 数据挖掘
CogLTX:应用BERT处理长文本
CogLTX:应用BERT处理长文本
1016 0
CogLTX:应用BERT处理长文本
|
8月前
|
机器学习/深度学习 人工智能 算法
大型多模态推理模型技术演进综述:从模块化架构到原生推理能力的综合分析
该研究系统梳理了大型多模态推理模型(LMRMs)的技术发展,从早期模块化架构到统一的语言中心框架,提出原生LMRMs(N-LMRMs)的前沿概念。论文划分三个技术演进阶段及一个前瞻性范式,深入探讨关键挑战与评估基准,为构建复杂动态环境中的稳健AI系统提供理论框架。未来方向聚焦全模态泛化、深度推理与智能体行为,推动跨模态融合与自主交互能力的发展。
641 13
大型多模态推理模型技术演进综述:从模块化架构到原生推理能力的综合分析
|
11月前
|
机器学习/深度学习 数据采集 数据处理
Pipeline基础语法
Pipeline是处理数据流和构建机器学习模型的重要工具,它能够简化代码、提高可读性并减少错误。通过本篇文章,读者应能掌握Pipeline的基本语法、使用方法及其在数据科学中的重要性。正确使用Pipeline将极大地提高机器学习项目的效率与可靠性。希望本文能为您的数据处理工作提供实用的指导和帮助。
1173 9
|
人工智能 自然语言处理 人机交互
|
机器学习/深度学习 人工智能 自然语言处理
复旦大学数据智能与社会计算实验室:科研与创新的前沿阵地
复旦大学数据智能与社会计算实验室(Fudan DISC)专注自然语言处理、机器学习等领域研究,发表80余篇顶级会议论文,涉及智慧医疗等交叉应用。实验室拥有多名知名教授,与华为等企业合作,推动科研成果转化,如华为项目获EMNLP发表和优秀技术奖。未来,实验室将持续深化AI研究,强化政产学研合作,为智能社会贡献力量。
|
SQL 人工智能 自然语言处理
【AI 技术分享】大模型与数据检索的探索实践
本文基于2024年9月27日与阿里云合办的线下沙龙分享整理而成,探讨如何通过大语言模型(LLM)让数据访问更简单。随着企业数据量增长,传统数据访问方式已难以满足需求。LLM结合自然语言检索,使非技术用户能直接用自然语言与数据交互,降低数据访问门槛。文章介绍了NL2SQL技术,通过LLM理解自然语言问题并生成SQL查询,实现高效数据获取。同时,探讨了AskTable架构及其在实际应用中的挑战与解决方案。
1158 5
【AI 技术分享】大模型与数据检索的探索实践
|
机器学习/深度学习 人工智能 自然语言处理
探索AIGC的底层技术:人工智能通用计算架构
探索AIGC的底层技术:人工智能通用计算架构
948 3
|
监控 Serverless API
走出大模型部署新手村!小明这样用魔搭×函数计算
走出大模型部署新手村!小明这样用魔搭×函数计算
105739 60
|
机器学习/深度学习 存储 自然语言处理
深度学习-生成式检索-论文速读-2024-09-14(上)
深度学习-生成式检索-论文速读-2024-09-14(上)