Re28:读论文 CECP Charge Prediction by Constitutive Elements Matching of Crimes

简介: Re28:读论文 CECP Charge Prediction by Constitutive Elements Matching of Crimes

1. Background


传统罪名预测任务被视为文本分类任务,但是加上了法律知识。两种主流使用法律知识的方式为:

  1. 评估事实描述和法条之间的关联,用以预测罪名123,这种做法粒度太粗,因为单个法条可能对应多条罪名,不足以区分这些易混淆罪名之间的细微差别。
  2. 手动抽取legal attributes(如罪犯是否有暴力行为)456,这对专家人力要求很高,而且难以理解。


大陆法系的犯罪要素(CE)是重要的司法解释(不在法条中),借以指导判决。

在中国,每个罪名由这4个部分描述:

  • subject element
  • subjective element
  • object element
  • objective element


CE示例图:

image.png

嫌疑人的事实匹配了纵火罪的4个CE,所以被叛纵火罪。


7利用了objective和subjective信息,但完整利用4个CE也很重要。


CE的识别逻辑顺序:

  • 损害事实(objectIve):火灾
  • 原因(subject):火是否人造
  • 罪犯是否有责任,有什么责任(subjective):当事人精神态度(区别蓄意纵火和失火罪)
  • 什么社会关系(object)被破坏,罪名是否成立8:公众安全是否被损害,是否有人获罪


2. CECP模型


image.png

legal agent:自动挖掘CE实例(句子)

actor-critic框架

用encoder network中得到的事实描述和CE的嵌入作为observations,按类型组合不同罪名的CE,依CE逻辑顺序循环迭代选取每一类最重要的实例,在每一时间步,加权聚合该类及对应该类选出的句子,权重由其间的relevance estimation计算得到。这相当于提供了选出句子和CE在最相关实例和罪名上的摘要表征。然后agent基于这个CE的摘要表征和历史表征(编码以前对所有CE类选出的句子,强调高相关权重的句子)选出一个未选过的句子,这个历史表征表示“以前识别出的重点”,由当前类选出句子的摘要表征更新。

最后用选出句的摘要表征和所有CE类的CE来预测罪名。

reward function基于预测结果和被选出句子的重复程度设计。


强化学习我不太懂,也未作更多了解。


2.1 Encoder Network

编码事实描述和CE

  1. Fact Encoder

GRU

  1. CE Encoder


2.2 Reinforcement Learning Module


2.3 Prediction Network


3. 实验


3.1 数据集

image.png


3.2 baseline

常规文本分类模型OTC:

  • TextCNN
  • DPCNN
  • HARNN
  • BERT
  • SAttCaps


基于法律知识的文本分类模型LKB:

  • FewShot
  • FLA
  • LADAN


3.3 主实验结果

image.png


3.4 模型分析

image.png

相关文章
|
人工智能 搜索推荐 算法
爱思唯尔的KBS——模板、投稿、返修、接收的总结
爱思唯尔的KBS——模板、投稿、返修、接收的总结
5802 3
|
存储 SQL JavaScript
聊一聊常见的浏览器数据存储方案(上)
聊一聊常见的浏览器数据存储方案(上)
678 0
|
安全 网络安全 数据安全/隐私保护
[CTF/网络安全] 攻防世界 weak_auth 解题详析
题目描述:小宁写了一个登陆验证页面,随手就设了一个密码。
825 0
|
JSON API 数据格式
postman如何发送json请求其中file字段是一个图片
postman如何发送json请求其中file字段是一个图片
727 4
|
移动开发 供应链 小程序
如何快速开发一套MES系统?
如何快速开发一套MES系统?本文介绍了从需求评估到持续优化的全流程策略,包括利用低代码平台快速搭建基础模块、梳理业务流程、核心功能模块搭建、用户参与测试、系统集成与数据一致性、培训部署及技术支持等环节。此外,还提供了现成的MES系统源码,帮助企业快速构建或定制化MES系统,减少开发时间和成本,确保系统稳定性和功能性。
1165 1
|
Cloud Native Java Nacos
Nacos 1.4.1核心功能组件及使用入门
以上步骤提供了 Nacos 1.4.1 的基本使用概览,具体的配置和使用可能根据你的环境和需求有所不同。
686 6
|
机器学习/深度学习 数据可视化 TensorFlow
Python深度学习基于Tensorflow(4)Tensorflow 数据处理和数据可视化
Python深度学习基于Tensorflow(4)Tensorflow 数据处理和数据可视化
362 3
|
机器学习/深度学习 自然语言处理 算法
词频-逆文档频率(Term Frequency-Inverse Document Frequency,
词频-逆文档频率(Term Frequency-Inverse Document Frequency,简称 TF-IDF)是一种统计方法,用以评估一个词对于一个文本或一组文本的重要性。
1406 3
|
JavaScript
vue常用正则表达式判断身份证格式
这两个正则表达式分别用于验证18位和15位身份证号码。请注意,正则表达式只能用于初步验证身份证格式是否正确,不能验证身份证号码是否真实有效。在实际应用中,还需要进行进一步的校验,例如校验身份证的校验位等。
886 0

热门文章

最新文章