Re28:读论文 CECP Charge Prediction by Constitutive Elements Matching of Crimes

简介: Re28:读论文 CECP Charge Prediction by Constitutive Elements Matching of Crimes

1. Background


传统罪名预测任务被视为文本分类任务,但是加上了法律知识。两种主流使用法律知识的方式为:

  1. 评估事实描述和法条之间的关联,用以预测罪名123,这种做法粒度太粗,因为单个法条可能对应多条罪名,不足以区分这些易混淆罪名之间的细微差别。
  2. 手动抽取legal attributes(如罪犯是否有暴力行为)456,这对专家人力要求很高,而且难以理解。


大陆法系的犯罪要素(CE)是重要的司法解释(不在法条中),借以指导判决。

在中国,每个罪名由这4个部分描述:

  • subject element
  • subjective element
  • object element
  • objective element


CE示例图:

image.png

嫌疑人的事实匹配了纵火罪的4个CE,所以被叛纵火罪。


7利用了objective和subjective信息,但完整利用4个CE也很重要。


CE的识别逻辑顺序:

  • 损害事实(objectIve):火灾
  • 原因(subject):火是否人造
  • 罪犯是否有责任,有什么责任(subjective):当事人精神态度(区别蓄意纵火和失火罪)
  • 什么社会关系(object)被破坏,罪名是否成立8:公众安全是否被损害,是否有人获罪


2. CECP模型


image.png

legal agent:自动挖掘CE实例(句子)

actor-critic框架

用encoder network中得到的事实描述和CE的嵌入作为observations,按类型组合不同罪名的CE,依CE逻辑顺序循环迭代选取每一类最重要的实例,在每一时间步,加权聚合该类及对应该类选出的句子,权重由其间的relevance estimation计算得到。这相当于提供了选出句子和CE在最相关实例和罪名上的摘要表征。然后agent基于这个CE的摘要表征和历史表征(编码以前对所有CE类选出的句子,强调高相关权重的句子)选出一个未选过的句子,这个历史表征表示“以前识别出的重点”,由当前类选出句子的摘要表征更新。

最后用选出句的摘要表征和所有CE类的CE来预测罪名。

reward function基于预测结果和被选出句子的重复程度设计。


强化学习我不太懂,也未作更多了解。


2.1 Encoder Network

编码事实描述和CE

  1. Fact Encoder

GRU

  1. CE Encoder


2.2 Reinforcement Learning Module


2.3 Prediction Network


3. 实验


3.1 数据集

image.png


3.2 baseline

常规文本分类模型OTC:

  • TextCNN
  • DPCNN
  • HARNN
  • BERT
  • SAttCaps


基于法律知识的文本分类模型LKB:

  • FewShot
  • FLA
  • LADAN


3.3 主实验结果

image.png


3.4 模型分析

image.png

相关文章
|
16天前
|
算法 数据挖掘
文献解读-Prediction of axillary lymph node metastasis in triple-negative breast cancer by multi-omics analysis and an integrated model
研究旨在为三阴性乳腺癌患者提供更准确的腋窝淋巴结转移风险评估工具。研究者综合分析了临床病理信息、基因组和转录组数据,构建了一个多组学预测模型。
27 4
|
机器学习/深度学习 移动开发 自然语言处理
DEPPN:Document-level Event Extraction via Parallel Prediction Networks 论文解读
当在整个文档中描述事件时,文档级事件抽取(DEE)是必不可少的。我们认为,句子级抽取器不适合DEE任务,其中事件论元总是分散在句子中
150 0
DEPPN:Document-level Event Extraction via Parallel Prediction Networks 论文解读
|
机器学习/深度学习 自然语言处理 数据可视化
EventGraph:Event Extraction as Semantic Graph Parsing 论文解读
事件抽取涉及到事件触发词和相应事件论元的检测和抽取。现有系统经常将事件抽取分解为多个子任务,而不考虑它们之间可能的交互。
87 0
|
机器学习/深度学习 自然语言处理
【论文精读】COLING 2022 - DESED: Dialogue-based Explanation for Sentence-level Event Detection
最近许多句子级事件检测的工作都集中在丰富句子语义上,例如通过多任务或基于提示的学习。尽管效果非常好,但这些方法通常依赖于标签广泛的人工标注
118 0
|
数据可视化 数据挖掘
【论文解读】Dual Contrastive Learning:Text Classification via Label-Aware Data Augmentation
北航出了一篇比较有意思的文章,使用标签感知的数据增强方式,将对比学习放置在有监督的环境中 ,下游任务为多类文本分类,在低资源环境中进行实验取得了不错的效果
506 0
|
机器学习/深度学习 自然语言处理 数据挖掘
【文本分类】Attention-Based Bidirectional Long Short-Term Memory Networks for Relation Classification
【文本分类】Attention-Based Bidirectional Long Short-Term Memory Networks for Relation Classification
179 0
【文本分类】Attention-Based Bidirectional Long Short-Term Memory Networks for Relation Classification
|
机器学习/深度学习 边缘计算 人工智能
Re0:读论文 PPNP/APPNP Predict then Propagate: Graph Neural Networks meet Personalized PageRank
Re0:读论文 PPNP/APPNP Predict then Propagate: Graph Neural Networks meet Personalized PageRank
Re0:读论文 PPNP/APPNP Predict then Propagate: Graph Neural Networks meet Personalized PageRank
|
机器学习/深度学习 自然语言处理 搜索推荐
Re25:读论文 Lecut+JOTR Incorporating Retrieval Information into the Truncation of Ranking Lists in the
Re25:读论文 Lecut+JOTR Incorporating Retrieval Information into the Truncation of Ranking Lists in the
Re25:读论文 Lecut+JOTR Incorporating Retrieval Information into the Truncation of Ranking Lists in the
|
数据挖掘
Re29:读论文 D2GCLF: Document-to-Graph Classifier for Legal Document Classification
Re29:读论文 D2GCLF: Document-to-Graph Classifier for Legal Document Classification
Re29:读论文 D2GCLF: Document-to-Graph Classifier for Legal Document Classification
|
机器学习/深度学习
Re11:读论文 EPM Legal Judgment Prediction via Event Extraction with Constraints
Re11:读论文 EPM Legal Judgment Prediction via Event Extraction with Constraints
Re11:读论文 EPM Legal Judgment Prediction via Event Extraction with Constraints