智能司法领域的 NLP 技术与应用|学习笔记

本文涉及的产品
NLP 自学习平台,3个模型定制额度 1个月
NLP自然语言处理_基础版,每接口每天50万次
NLP自然语言处理_高级版,每接口累计50万次
简介: 快速学习智能司法领域的 NLP 技术与应用

发者学堂课程【达摩院自然语言处理 NLP 技术和应用:智能司法领域的 NLP 技术与应用】学习笔记,与课程紧密联系,让用户快速学习知识。

课程地址https://developer.aliyun.com/learning/course/41/detail/955


智能司法领域的 NLP 技术与应用


内容介绍:

一、智能司法背景

二、智能司法 NLP 涉足的环节

三、智能审核的服务中台

四、智能司法的应用点


一、智能司法背景

在浙江省每年案件量呈现10%~20%的增长,员额法官的数量基本上保持不变,因此就出现了案多人少。目前每年每个法官大概需要办理345个案件,并且这个数据在持续的上升。

image.png

其次简单案件花费了大量的精力而且这些很多都是重复性的的劳动。此外,裁判标准较难以统一;同案同判,缺少一定的标尺;除了法官这块的一些困境之外,当事人在里边也有两个困境。第一,他不会写诉讼状,不善于归纳40个理由。

第二,整个的结果较难预测,而且整个司法裁判的过程不是特别透明。基于此,就做出了一个项目叫智能审判的引擎。一方面帮助法官减负,提升法官的办案效率,另一方面方面能更好的便民。


二、智能司法 NLP 涉足的环节

智能司法涉足的 NLP 环节可以从刚开始的导述到最终的裁判。

在导述阶段,有自助的问答机器人,有类案推送和结果预测。此外,还有调节建议的生成。在立案阶段,有诉状的生成,包括要素完整性的判断。在庭审阶段,有笔录自动生成(语音转文字)以及文本摘要的生成。在判决阶段,有类案推送、预判结果和要点审核、证据三性认定以及判决书的生成。

image.png

以上可以看出整个数据,整个闭环数据的积累有利于各个环节的之中迭代优化。


三、智能审核的服务中台

image.png

在底层,有两个原子化的能力。一个是司法知识图谱协作平台能力,另一个是 NLP 自学习平台能力。  

NLP  平台融入了标注、预测和训练为一体的平台。 LFK 可以根据自己的项目定制自己化的标注。

我们可以做到自适应当中的训练和预测。知识图谱的平台,可以把他们判案的逻辑树立到我们的平台上。

随着数据的积累,知识图谱会有一定的判案能力。在上层,有解决方案的建设平台。包括一些通用能力和一些案件处理能力。通用能力包括案件文本结构化、OCR、ASR调节策略生成以及 AI 问答机器人、庭审笔录的生成等等。


四、智能司法的应用点

1.咨询的法律背景

AI咨询机器人在很多场景下都会使用到,在智能司法当中其更多的是解决一些专业的司法方面问题。

2.智能司法应用点①——AI 咨询机器人

人工客服也是有一些法律背景的。第一、AI客服可以减少一定的人工成本,第二、它可以根据客户的回答,经过引导没有描述清楚的一些必要性信息的填写,第三、根据提问判断是否可以做进一步的邀约。邀约专业的人士来回答此问题。咨询机器人首先对一些问题做大致的分类,子类当中目前有八大领域,上百个子类。

image.png

此外,除了叫做意图识别之外,当做一些相似问题的推荐时,有意图识别会识别到某一个子类上去。当前子类下有很多问题。

相似的问题很多的回答不太一样。目前我们拥有大量的采访文书、知识图谱、法律百科等等。后面还需要做一些信息的整合,做为答案内容的一个优化。

AI咨询机器人是多轮对话,在意图识别、相似问题技术、答案内容优化、多轮对话研究点上,都会同步进展。目前也有一些阶段性的成果。

3.智能司法应用点②——信息抽取

基于审判要素的抽取是跟案由相关的,因此将会抽取20个维度。信

息抽取的应用是信息回填、类案推送、信息分类等。

image.png

4.智能司法的应用点③——类案推荐

类案推荐大部分是基于关键词的匹配方式,也就是计算两个文档的相似性,这边的切入点是基于要素的匹配

image.png

两个文案相似性里面有很多不可以参与里面的计算,如人名,地名等等。做好了案件的结构化之后,可以很好地基于案由关注的一些维度处理出来,基于两个案由关注的一些维度,做一个相似度的匹配,最终算出一个像素的一个值。在这个方面很好地辅助金融在智能的辅助审判以及法律咨询的平台。

很多人对法律咨询的平台类似于一个不太懂法律的用户,对他们进行提问,问一个问题,之后,可以根据这个问题找一些跟当天问题较相似的已经审判过的案件,把该案件返回给用户,给他们做一个参考。

5.智能司法的应用点④——庭审笔录的撰写

ASR最近两年大规模地使用在庭审笔录上面,通过对比发现庭ASR庭审笔录和数据源的庭审笔录大概只60%~70%是相同的,而30%左右是不同的。所以需要做的几个事情,第一、针对庭审笔录进展一个语言模型。第二、口语文本的顺滑,包括一些词汇的识别,包括一些重复片段的检测。第三、在实体修正方面,包括一些热词的修正,对其挖掘一些专有的术语予以修正。第四、标点还原,包括多任务的还原以及书名号的还原。第五、文本标准化,包括数字文本标准化,里面分为有监督和无监督标准化。ASR最近两年大规模地使用在庭审笔录上面,通过对比发现庭ASR庭审笔录和数据源的庭审笔录大概只60%~70%是相同的,而30%左右是不同的。

image.png

对于实体修正后的事例,比如在法律术语上面“到签”变成“倒签”。修正后会把它们恢复到以前的文本中去。通过这样的方式可以降低速记员修改率20%。

6.智能司法的应用点⑤——自动裁判

因为需要对结果做一个预判,司法是一个严谨的过程,每一步都需要一定的理由,因此采用基于图谱的裁判。

好处是:1、结果是可以解释,可以回溯的,便于撰写到裁判文书中。2、图谱制度可以不停地积累法官的裁判知识。当一个法条发生变动时,只需要修改图谱,需要改动算法和流程。

image.png

以网络交易纠纷中的欺诈案由为例,这是一个知识图谱的一个局部,顶点代表两个典型的诉讼请求,一个是退换货款另一个是三倍赔偿。

白色部分为未激活的区域,代表不诉不理,蓝色部分为激活的区域,每一个代表审查的点。

整个部分是自体向上的推理过程。如果根据前面的设施判定为欺诈,那么一定会退还货款。是否为三倍赔偿,要看当前的消费者,如果是一个正常的消费者,那么就会三倍赔偿。如果是一个职业打假人,那仅仅可能是退换货款。

image.png

左边的图形,是根据案件的表征同时训练两个纠纷的任务,一个是纠纷的原因,一个是纠纷的结果。同时还有两个诉讼的任务,一个是事实的认定,一个是审判的结果。

基于多任务多表征学习的智能审判,可以有效提升审判的结果。最右边的表格是实验一方面,评估了的是单任务的效果。另一方面通过实验对比,去掉类似于知识图谱或者买家卖家,都会有不同程度的下降。说明多任务多表征的智能审判是对整个审判结果是有明显的提升的。下降说明多任务多标准的智能审判对整个的审判结果是有明显的提升的。

7.智能司法的应用点⑥——裁判文书自动生成

image.png

裁判文书自动生成这块采用基于模板的信息点。基于信息的抽取,有大量的信息被处理出来,这些信息抽取可以很好的把这些信息放到裁判文书当中。

有一些基于这种逻辑的推理的判断,基于整个知识图谱,可以很好的把整个数据做一些内向的回溯,回添到裁判文书里面去,这是给予自动裁判文书生成的一个结果。

相关文章
|
9月前
|
存储 人工智能 自然语言处理
Pandas数据应用:自然语言处理
本文介绍Pandas在自然语言处理(NLP)中的应用,涵盖数据准备、文本预处理、分词、去除停用词等常见任务,并通过代码示例详细解释。同时,针对常见的报错如`MemoryError`、`ValueError`和`KeyError`提供了解决方案。适合初学者逐步掌握Pandas与NLP结合的技巧。
232 20
|
3月前
|
数据采集 自然语言处理 分布式计算
大数据岗位技能需求挖掘:Python爬虫与NLP技术结合
大数据岗位技能需求挖掘:Python爬虫与NLP技术结合
|
9月前
|
人工智能 自然语言处理 API
用自然语言控制电脑,字节跳动开源 UI-TARS 的桌面版应用!内附详细的安装和配置教程
UI-TARS Desktop 是一款基于视觉语言模型的 GUI 代理应用,支持通过自然语言控制电脑操作,提供跨平台支持、实时反馈和精准的鼠标键盘控制。
2614 17
用自然语言控制电脑,字节跳动开源 UI-TARS 的桌面版应用!内附详细的安装和配置教程
|
8月前
|
文字识别 自然语言处理 API
如何结合NLP(自然语言处理)技术提升OCR系统的语义理解和上下文感知能力?
通过结合NLP技术,提升OCR系统的语义理解和上下文感知能力。方法包括集成NLP模块、文本预处理、语义特征提取、上下文推理及引入领域知识库。代码示例展示了如何使用Tesseract进行OCR识别,并通过BERT模型进行语义理解和纠错,最终提高文本识别的准确性。相关API如医疗电子发票验真、车险保单识别等可进一步增强应用效果。
|
9月前
|
机器学习/深度学习 人工智能 自然语言处理
AI写作新时代:自然语言生成技术与写作助手的结合
AI写作新时代:自然语言生成技术与写作助手的结合
312 16
|
10月前
|
机器学习/深度学习 人工智能 自然语言处理
AI在自然语言处理中的突破:从理论到应用
AI在自然语言处理中的突破:从理论到应用
394 17
|
10月前
|
机器学习/深度学习 人工智能 自然语言处理
AI技术在自然语言处理中的应用
随着人工智能技术的不断发展,自然语言处理(NLP)已经成为了一个重要的应用领域。本文将介绍一些常见的NLP任务和算法,并通过代码示例来展示如何实现这些任务。我们将讨论文本分类、情感分析、命名实体识别等常见任务,并使用Python和相关库来实现这些任务。最后,我们将探讨NLP在未来的发展趋势和挑战。
|
11月前
|
机器学习/深度学习 人工智能 自然语言处理
探索AI在自然语言处理中的创新应用
本文旨在揭示人工智能技术如何革新自然语言处理领域。我们将从基础的文本分析到复杂的情感识别,逐步深入探讨AI如何提升语言理解的准确性和效率。文章将通过实际代码示例,展示AI技术在自然语言处理中的应用,并讨论其对日常生活的潜在影响。读者将获得关于AI技术在理解和生成自然语言方面的实用知识,以及如何将这些技术应用于解决现实世界问题的见解。
216 5
|
11月前
|
机器学习/深度学习 人工智能 自然语言处理
探索深度学习与自然语言处理的前沿技术:Transformer模型的深度解析
探索深度学习与自然语言处理的前沿技术:Transformer模型的深度解析
474 1
|
12月前
|
机器学习/深度学习 人工智能 自然语言处理
AI技术在自然语言处理中的应用与挑战
【10月更文挑战第3天】本文将探讨AI技术在自然语言处理(NLP)领域的应用及其面临的挑战。我们将分析NLP的基本原理,介绍AI技术如何推动NLP的发展,并讨论当前的挑战和未来的趋势。通过本文,读者将了解AI技术在NLP中的重要性,以及如何利用这些技术解决实际问题。