Re28:读论文 CECP Charge Prediction by Constitutive Elements Matching of Crimes

简介: Re28:读论文 CECP Charge Prediction by Constitutive Elements Matching of Crimes

1. Background


传统罪名预测任务被视为文本分类任务,但是加上了法律知识。两种主流使用法律知识的方式为:

  1. 评估事实描述和法条之间的关联,用以预测罪名123,这种做法粒度太粗,因为单个法条可能对应多条罪名,不足以区分这些易混淆罪名之间的细微差别。
  2. 手动抽取legal attributes(如罪犯是否有暴力行为)456,这对专家人力要求很高,而且难以理解。


大陆法系的犯罪要素(CE)是重要的司法解释(不在法条中),借以指导判决。

在中国,每个罪名由这4个部分描述:

  • subject element
  • subjective element
  • object element
  • objective element


CE示例图:

image.png

嫌疑人的事实匹配了纵火罪的4个CE,所以被叛纵火罪。


7利用了objective和subjective信息,但完整利用4个CE也很重要。


CE的识别逻辑顺序:

  • 损害事实(objectIve):火灾
  • 原因(subject):火是否人造
  • 罪犯是否有责任,有什么责任(subjective):当事人精神态度(区别蓄意纵火和失火罪)
  • 什么社会关系(object)被破坏,罪名是否成立8:公众安全是否被损害,是否有人获罪


2. CECP模型


image.png

legal agent:自动挖掘CE实例(句子)

actor-critic框架

用encoder network中得到的事实描述和CE的嵌入作为observations,按类型组合不同罪名的CE,依CE逻辑顺序循环迭代选取每一类最重要的实例,在每一时间步,加权聚合该类及对应该类选出的句子,权重由其间的relevance estimation计算得到。这相当于提供了选出句子和CE在最相关实例和罪名上的摘要表征。然后agent基于这个CE的摘要表征和历史表征(编码以前对所有CE类选出的句子,强调高相关权重的句子)选出一个未选过的句子,这个历史表征表示“以前识别出的重点”,由当前类选出句子的摘要表征更新。

最后用选出句的摘要表征和所有CE类的CE来预测罪名。

reward function基于预测结果和被选出句子的重复程度设计。


强化学习我不太懂,也未作更多了解。


2.1 Encoder Network

编码事实描述和CE

  1. Fact Encoder

GRU

  1. CE Encoder


2.2 Reinforcement Learning Module


2.3 Prediction Network


3. 实验


3.1 数据集

image.png


3.2 baseline

常规文本分类模型OTC:

  • TextCNN
  • DPCNN
  • HARNN
  • BERT
  • SAttCaps


基于法律知识的文本分类模型LKB:

  • FewShot
  • FLA
  • LADAN


3.3 主实验结果

image.png


3.4 模型分析

image.png

相关文章
|
7月前
|
机器学习/深度学习 数据挖掘 Python
[Bart]论文实现:Denoising Sequence-to-Sequence Pre-training for Natural Language Generation...
[Bart]论文实现:Denoising Sequence-to-Sequence Pre-training for Natural Language Generation...
49 0
|
机器学习/深度学习 存储 自然语言处理
RAAT: Relation-Augmented Attention Transformer for Relation Modeling in Document-Level 论文解读
在文档级事件提取(DEE)任务中,事件论元总是分散在句子之间(跨句子问题),多个事件可能位于一个文档中(多事件问题)。在本文中,我们认为事件论元的关系信息对于解决上述两个问题具有重要意义,并提出了一个新的DEE框架
131 0
|
机器学习/深度学习 移动开发 自然语言处理
DEPPN:Document-level Event Extraction via Parallel Prediction Networks 论文解读
当在整个文档中描述事件时,文档级事件抽取(DEE)是必不可少的。我们认为,句子级抽取器不适合DEE任务,其中事件论元总是分散在句子中
132 0
DEPPN:Document-level Event Extraction via Parallel Prediction Networks 论文解读
|
机器学习/深度学习 自然语言处理 算法
SS-AGA:Multilingual Knowledge Graph Completion with Self-Supervised Adaptive Graph Alignment 论文解读
预测知识图(KG)中缺失的事实是至关重要的,因为现代知识图远未补全。由于劳动密集型的人类标签,当处理以各种语言表示的知识时,这种现象会恶化。
104 0
|
机器学习/深度学习 自然语言处理
【论文精读】COLING 2022 - DESED: Dialogue-based Explanation for Sentence-level Event Detection
最近许多句子级事件检测的工作都集中在丰富句子语义上,例如通过多任务或基于提示的学习。尽管效果非常好,但这些方法通常依赖于标签广泛的人工标注
96 0
|
机器学习/深度学习 存储 数据挖掘
Global Constraints with Prompting for Zero-Shot Event Argument Classification 论文解读
确定事件论元的角色是事件抽取的关键子任务。大多数以前的监督模型都利用了昂贵的标注,这对于开放域应用程序是不实际的。
74 0
|
自然语言处理 算法 知识图谱
DEGREE: A Data-Efficient Generation-Based Event Extraction Model论文解读
事件抽取需要专家进行高质量的人工标注,这通常很昂贵。因此,学习一个仅用少数标记示例就能训练的数据高效事件抽取模型已成为一个至关重要的挑战。
161 0
|
机器学习/深度学习 自然语言处理 数据挖掘
【文本分类】Attention-Based Bidirectional Long Short-Term Memory Networks for Relation Classification
【文本分类】Attention-Based Bidirectional Long Short-Term Memory Networks for Relation Classification
161 0
【文本分类】Attention-Based Bidirectional Long Short-Term Memory Networks for Relation Classification
|
机器学习/深度学习 自然语言处理 搜索推荐
Re25:读论文 Lecut+JOTR Incorporating Retrieval Information into the Truncation of Ranking Lists in the
Re25:读论文 Lecut+JOTR Incorporating Retrieval Information into the Truncation of Ranking Lists in the
Re25:读论文 Lecut+JOTR Incorporating Retrieval Information into the Truncation of Ranking Lists in the
|
自然语言处理
Re13:读论文 Gender and Racial Stereotype Detection in Legal Opinion Word Embeddings
Re13:读论文 Gender and Racial Stereotype Detection in Legal Opinion Word Embeddings
Re13:读论文 Gender and Racial Stereotype Detection in Legal Opinion Word Embeddings