演讲嘉宾简介:王瑞宾,阿里云智能AI MVP,北京华夏电通发展规划总监。
以下内容根据演讲视频以及PPT整理而成。
北京华夏电通科技有限公司成立于2001年,是一家多年深耕于司法领域的信息化建设工作的公司。从检察院、法院的一级专网到如今正在建设中的“智慧法院”和“智慧检察院”等项目中都有华夏电通的身影。可以说华夏电通参与了中国国家司法信息建设的全过程,因此也对于行业也有一些更加深刻的理解和实践。
华夏电通从2017年开始和阿里接触,在2018年双方达成战略合作协议。在这个过程中,阿里帮助华夏电通开拓了很强的技术思维。与此同时,华夏电通也充分地将人工智能技术应用到了自己的产品中去,比如结合庭审的特殊场景对于语音识别技术进行了场景化定制,对于整体产品的品质提升也起到了非常大的帮助。
本文主要分享的是人工智能检测技术在司法监督管理上的应用。文章将主要分为以下的三个部分:
1.业务分析
2.应用实践
3.困惑与展望
一、业务分析
首先,提出一个问题:如何定义司法监督。广义上的司法监督包含的范围很广,包含了司法部门对于政府行为、个人行为的合法性监督,同时也包含了司法部门之间的相互监督。而在本文中主要涉及的是司法机构的行为和活动的狭义司法监督。
司法活动监督
司法活动监督是监督主体依照国家宪法和法律的规定,对于司法机关以及其工作人员的司法活动的合法性所进行的监督。其中主要涉及的主体包括以下四种:
人大监督:立法单位对于执法单位的监督,公检法全过程监督。
检查监督:检察院对法院、司法执行部门的监督,案件审理公正性、刑罚执行合法性监督。
上下级监督:上级司法机关对下级司法机关执法过程的监督。
人民监督:司法内部监督的一种补充监督。
监督事务
对于具体执行监督过程而言,从技术的角度来看,包括了行为监督、形象监督、过程监督以及结果监督。行为指的是执法过程是否合法,是否存在暴力执法,犯人在看守过程中是否遭受了暴力对待,公安机关在逮捕犯罪分子的时候是否出现了超出允许的行为,法官日常和当事人接触以及开庭过程中的行为是否合规等,这些信息更多的是从图像中进行提取的。对于形象而言,比如法官开庭时是否穿着法袍,公安出警时是否穿着警服等。第三点是过程,包括每一项司法过程是否被完整记录,是否按照法律要求执行相应的过程。第四点就是结果,即判决的结果是否合理、合法。而从时间点上进行划分,可以分为事中和事后的监督。
传统工作方法
传统监督的工作方法就是看视频、查文件、查系统、找人谈。所谓看视频就是坐下来观看录制视频或者直播视频;查文件就是翻阅现有的文件记录;查系统就是查现在司法部门里面各类能够记录执法过程的应用系统,通过查找统计报表在进行手工汇总;最后就是找人去谈。大家可以想象一下,全中国如此之多的案件量,要想要实现对于所有案件的监督,在人工模式下是无法实现的,因此往往是人工抽样的方式实现的,而抽样率可能不到1%,比如视频抽检率仅在万分之几左右。这是因为随着音视频技术的不断发展,人工所能覆盖的面越来越小,因此对于监督工作的方法改变需求非常迫切。基于此,华夏电通也在不断改善自己的产品,根据不同的应用场景来拓展应用实践。
二、应用实践
在这一部分为大家介绍了一些华夏电通已经落地实现的应用实践场景。
- 立案窗口巡查:这主要是针对法院的应用,在立案窗口中会对于收案过程行为的规范进行监督,也就是对于立案窗口的法官和当事人的交流过程的用语、着装等是否规范以及态度是否端正等进行监督。这些数据需要从诉讼大厅的监控中进行抽取。此外,还有需要对于案卷的系统数据以及立案时所用卷宗是否完整等进行监督。
- 庭审过程巡查:对于庭审过程中法官的行为、着装是否得当,是否存在违规、违法行为,笔录的记录是否完整,以及庭审是否符合完整的法律程序约定要求等进行监督。
- 裁判文书巡查:对于判决内容进行检查,对于文书完整性、用于规范性进行内部检查,此外还有未来将会持续推进的检察院对于裁判文书的合法性检查。
- 关键场所巡查:关键场所巡查目前主要的应用场景在法院,比如重大庭审时法院门口以及日常时间法院门口是否存在可疑行为人等,这属于将通用技术应用到专业场景中的应用。
- 刑罚执行巡查:主要指的是检察院对于监狱、看守所内部的日常监控图形进行巡查。
- 刑讯过程巡查:主要指的是对于公安的刑讯过程进行监督检查。
应用技术
在以上场景的自动化过程落地实施中,用到了很多的技术,包括了视频分析、音频分析、文本分析、语音识别、文本识别以及自然语言分析等。
- 视频分析包括对于违规行为、违规形象以及视频质量的分析。
- 音频分析包括对于声音质量以及特殊声音的分析。
- 文本分析包括关键分析以及冲突检测等。
- 语音识别包括用语分析以及特殊声音分析等,当然这里面更好的是使用声纹分析,华夏电通在这方面正在与阿里进行沟通,希望能够在未来展开合作。
- 文本识别则包括备查文件电子化和票据识别,比如通过OCR技术来提取关键信息。
- 自然语言分析则包括了文书逻辑和语法的分析等。
对于这些技术而言,也正是刚起步的阶段。因此,华夏电通和阿里巴巴正在和法院和检察院等单位共同寻找更好的模式,希望能够使得人工智能技术和司法监督检查工作实现更好的结合。
三、困惑及展望
应用困惑
华夏电通在和阿里合作做人工智能相关问题的过程中也遇到了一些问题和困惑,主要包括三个,即准确度、效率以及成长性。对于准确度而言,大家很好理解,语音识别的准确度在庭审里面以及监督检查中很重要,不能对于没有出现问题的地方识别出问题,这部分需要和阿里巴巴合作不断进行提升。对于效率而言,如今视频数据量非常之大,如果将所有的庭审视频或者监控记录全部播放一遍,所需要的时间以及运算量都会非常大,因此很难完成。所以,对于倍速检测、抽帧检测等技术如何更加深入地使用,来提升视频的检测效率,保证在对原始数据进行检查的基础之上,进一步提升检查效率是一件华夏电通一直在努力的事情。对于成长性而言,无论是对于法院还是检察院来说,监督的场景一直在扩展,而机器学习的过程更多还是依赖于后台的技术大牛们。往往需要将数据样本采集完成然后交给这些技术大牛们来完成。而在未来,华夏电通希望阿里能够提供更多的行业性的学习工具,也希望能够尽快地获取到这些行业性的学习工具。这是因为司法行业的特殊性,无法将所有的数据搬移到阿里云上去,因此只能依靠自己通过学习工具来训练模型,而产生学习的结果可以反馈给阿里,帮助引擎的成长。这也是华夏电通和阿里巴巴合作总结出来的比较成熟的技术路线,同时,这种做法也是符合客户的预期的。
最后,华夏电通希望能够通过业务和人工智能等技术的融合,构建出自动化为主导的新司法监督工作样态。