Re28:读论文 CECP Charge Prediction by Constitutive Elements Matching of Crimes

简介: Re28:读论文 CECP Charge Prediction by Constitutive Elements Matching of Crimes

1. Background


传统罪名预测任务被视为文本分类任务,但是加上了法律知识。两种主流使用法律知识的方式为:

  1. 评估事实描述和法条之间的关联,用以预测罪名123,这种做法粒度太粗,因为单个法条可能对应多条罪名,不足以区分这些易混淆罪名之间的细微差别。
  2. 手动抽取legal attributes(如罪犯是否有暴力行为)456,这对专家人力要求很高,而且难以理解。


大陆法系的犯罪要素(CE)是重要的司法解释(不在法条中),借以指导判决。

在中国,每个罪名由这4个部分描述:

  • subject element
  • subjective element
  • object element
  • objective element


CE示例图:

image.png

嫌疑人的事实匹配了纵火罪的4个CE,所以被叛纵火罪。


7利用了objective和subjective信息,但完整利用4个CE也很重要。


CE的识别逻辑顺序:

  • 损害事实(objectIve):火灾
  • 原因(subject):火是否人造
  • 罪犯是否有责任,有什么责任(subjective):当事人精神态度(区别蓄意纵火和失火罪)
  • 什么社会关系(object)被破坏,罪名是否成立8:公众安全是否被损害,是否有人获罪


2. CECP模型


image.png

legal agent:自动挖掘CE实例(句子)

actor-critic框架

用encoder network中得到的事实描述和CE的嵌入作为observations,按类型组合不同罪名的CE,依CE逻辑顺序循环迭代选取每一类最重要的实例,在每一时间步,加权聚合该类及对应该类选出的句子,权重由其间的relevance estimation计算得到。这相当于提供了选出句子和CE在最相关实例和罪名上的摘要表征。然后agent基于这个CE的摘要表征和历史表征(编码以前对所有CE类选出的句子,强调高相关权重的句子)选出一个未选过的句子,这个历史表征表示“以前识别出的重点”,由当前类选出句子的摘要表征更新。

最后用选出句的摘要表征和所有CE类的CE来预测罪名。

reward function基于预测结果和被选出句子的重复程度设计。


强化学习我不太懂,也未作更多了解。


2.1 Encoder Network

编码事实描述和CE

  1. Fact Encoder

GRU

  1. CE Encoder


2.2 Reinforcement Learning Module


2.3 Prediction Network


3. 实验


3.1 数据集

image.png


3.2 baseline

常规文本分类模型OTC:

  • TextCNN
  • DPCNN
  • HARNN
  • BERT
  • SAttCaps


基于法律知识的文本分类模型LKB:

  • FewShot
  • FLA
  • LADAN


3.3 主实验结果

image.png


3.4 模型分析

image.png

相关文章
|
人工智能 搜索推荐 算法
爱思唯尔的KBS——模板、投稿、返修、接收的总结
爱思唯尔的KBS——模板、投稿、返修、接收的总结
4674 3
|
存储 SQL JavaScript
聊一聊常见的浏览器数据存储方案(上)
聊一聊常见的浏览器数据存储方案(上)
544 0
|
安全 网络安全 数据安全/隐私保护
[CTF/网络安全] 攻防世界 weak_auth 解题详析
题目描述:小宁写了一个登陆验证页面,随手就设了一个密码。
744 0
|
12月前
|
存储 人工智能 安全
面向法律场景的大模型 RAG 检索增强解决方案
检索增强生成模型结合了信息检索与生成式人工智能的优点,从而在特定场景下提供更为精准和相关的答案。以人工智能平台 PAI 为例,为您介绍在云上使用一站式白盒化大模型应用开发平台 PAI-LangStudio 构建面向法律场景的大模型 RAG 检索增强解决方案,应用构建更简便,开发环境更直观。此外,PAI 平台同样发布了面向医疗、金融和教育领域的 RAG 解决方案。
|
分布式计算 数据挖掘 云计算
CCF推荐C类会议和期刊总结:(计算机体系结构/并行与分布计算/存储系统领域)
中国计算机学会(CCF)在计算机体系结构、并行与分布计算、存储系统领域推荐了一系列C类会议和期刊。此汇总涵盖了各期刊和会议的全称、出版社、dblp文献网址及研究领域,为学者和研究人员提供了重要的学术交流资源。列表包括《ACM Journal on Emerging Technologies in Computing Systems》、《Concurrency and Computation: Practice and Experience》等期刊,以及ISPA、CCGRID等会议。这些资源对推动领域内的学术交流和技术进步具有重要意义。
CCF推荐C类会议和期刊总结:(计算机体系结构/并行与分布计算/存储系统领域)
|
JSON API 数据格式
postman如何发送json请求其中file字段是一个图片
postman如何发送json请求其中file字段是一个图片
579 4
|
Cloud Native Java Nacos
Nacos 1.4.1核心功能组件及使用入门
以上步骤提供了 Nacos 1.4.1 的基本使用概览,具体的配置和使用可能根据你的环境和需求有所不同。
571 6
|
机器学习/深度学习 自然语言处理 算法
词频-逆文档频率(Term Frequency-Inverse Document Frequency,
词频-逆文档频率(Term Frequency-Inverse Document Frequency,简称 TF-IDF)是一种统计方法,用以评估一个词对于一个文本或一组文本的重要性。
1144 3
|
JavaScript
vue常用正则表达式判断身份证格式
这两个正则表达式分别用于验证18位和15位身份证号码。请注意,正则表达式只能用于初步验证身份证格式是否正确,不能验证身份证号码是否真实有效。在实际应用中,还需要进行进一步的校验,例如校验身份证的校验位等。
715 0