大数据解读2014年中国裁判文书公开之(一)

本文涉及的产品
云原生大数据计算服务 MaxCompute,5000CU*H 100GB 3个月
云原生大数据计算服务MaxCompute,500CU*H 100GB 3个月
简介:

法律大数据专题文章计划:

《大数据解读2014年中国裁判文书公开》为本次系列文章的主题,本文通过业界成熟大数据技术,希望对公开裁判文书分析、统计,从而对裁判文书公开情况量化评估。本系列文章具有尝试研究性质,文章的数据全部来自互联网全网公开数据,所得结论仅用于研究讨论目的,本文的评价依据均来自数据,不代表本文作者及作者所在机构立场。


本文为之(一),主要内容是对2014年全国及关注热点地区的裁判文书总体公开效果进行量化分析;专题之(二)通过大数据分析2014年全国民事案件的公开情况;专题之(三)通过大数据分析2014年全国刑事案件公开情况;专题之(四)通过大数据分析2014年全国行政及国家赔偿案件公开情况;专题之(五)通过大数据分析2014最高院诉讼案件的公开情况。为确保每篇文章经典、数据完整性和真实性,每一到两周推出一篇法律大数据专题文章,敬请读者期待!


在笔者热衷讨论法律大数据的朋友群中,“大数据”与最高院“裁判文书网”是密切相关的两个关键字。利用百度指数对检索关键词的分析(图表一),我们注意到,互联网用户对大数据的关注更早,并且关注用户人数明显多于裁判文书网关注用户。用户对裁判文书网的关注水平,20143月春节结束之后的关注度保持稳定上升平稳。两相比较可见,用户对大数据的关注波动情况要高于对裁判文书网关注的波动,对裁判文书网的关注相对平稳增长,笔者猜测用户对大数据的关注度受市场因素影响,而用户对裁判文书网的关注则受国家司法政策因素影响较多。



图表一:“大数据”与“裁判文书网”的关注对比


裁判文书在互联网公开是2014年司法公开改革的重要风向标。201411日,《最高人民法院关于人民法院在互联网公布裁判文书的规定》(下称《规定》)的实施,标志着由最高院在全国的范围内统一组织裁判文书网上公开工作。值得注意的是,该《规定》第四条明确了除“涉及国家秘密、个人隐私”、“涉及未成年人违法犯罪”、“调解结案”、“其他不宜互联网公布”的五种裁判文书外,人民法院的生效裁判文书应当在互联网公布。而早在2010年的10月,最高人民法院《关于人民法院在互联网公布裁判文书的规定》第二条规定“人民法院的生效裁判文书可以在互联网公布”,相比2014年《规定》赋予了诉讼当事人更申请不公开的权利“当事人明确请求不在互联网公布并有正当理由,且不涉及公共利益的”。


不同时期的两份最高院关于裁判文书互联网公开规定相对比,我们清晰看出2014年以前裁判文书公开赋予了法官、当事人宽泛的上网公开选择权利,而2014年的上网《规定》则更加体现了没有例外情形下,一律要求在互联网公开的司法改革理念。如今,2014年最高院上网《规定》已经颁布一年有余,具体实施情况如何?本文将通过大数据分析方法,对比2013年和2014年在互联网公开的全部裁判文书,在维度上横向跨地域、纵向跨时间对全国及热点地区的司法公开情况进行大数据实证研究,完全依据数据对最高院2014年上网《规定》的实施效果量化评估。为了更贴近实际情况避免主观判断,我们选取量化分析的省域均为对裁判文书公开关注热点省域,即选取来自百度指数对“裁判文书网”关注度最高的十大省域(含直辖市)。



图表二:关注裁判文书网的热点城市分布


互联网用户对于“裁判文书网”的关注热点地区,在中国地图上主要分布在沿海经济发达地区,以及国家区域中心城市,通过数据可视化图表二、三的展示,此结论没有太多意外比较符合直觉判断:经济活动发达地区的司法公开关注度往往更高。从关注“裁判文书网”的城市群体中来看,长江流域省会城市的用户普遍关注裁判文书网,而来自北京的用户则是关注裁判文书网程度最高的用户群体。从区域间的社会分工协作来看,司法权力行使的中心与大数据行业领军企业、人才在北京重合,我们有理由相信随着司法公开的推进,法律大数据将成为法律服务市场的朝阳产业,颠覆性的法律大数据创意将很可能出现在北京。

图表三:关注裁判文书网的热点省域(含直辖市)分布


20141月至今最为关注“裁判文书网”的热点省域(含直辖市),是我们大数据评价裁判文书公开情况的目标样本区域考虑到本文分析的大部分省域是司法改革的重点推进区域,通过大数据分析这些省域的公开情况,可在全样本统计意义上可对最高院2014年裁判文书上网《规定》的实际效果进行量化评估。但需提请注意的是,这些省域互联网用户对裁判文书网的关注度较高,并不一定意味着裁判文书公开情况最好(但是值得观察的问题),本文通过大数据测评裁判文书公开情况的目的在于回答:“互联网用户对于“裁判文书网”关注度是否与公开实际情况成正比?”在此我们首先假定:“对‘裁判文书网’关注度最高的十个省域,应该是公开情况好于全国平均水平的省域”,接下来我们将通过大数据分析验证此假定是否成立。


大数据分析一:全国20132014年裁判文书公开情况



区域

2013年审结互联网公开裁判文书数量

2014年审结互联网公开裁判文书数量

全国

1707733

5110880

图表四


通过大数据分析一,我们发现2014年审结互联网公开的裁判文书显著增长,接近2013年互联网公开数量的3倍,通过对互联网全部公开裁判文书分析,本文的数据分析除了最高院在裁判文书网公开的数据,还包括散落在各省高院、各地中院、专门法院、各县人民法院的裁判文书发布平台数据。通过全网数据比较,2014年全网公布的裁判文书量,在最高院上网《规定》作用下,相比2013年互联网公布量出现了指数性增长,并在2015年保持公开裁判文书快速增长,此外近期互联网公开的刑事起诉书数量显著增长也引起了笔者的注意。从裁判文书公开数量的意义来看,法院系统对于裁判文书的上网公开比以往改善了三倍以上,公开数据量呈现指数增长趋势已初现端倪。很多法律人意识到法律大数据的时代已经到了,在大数据分析、司法公开改革双重合的社会思潮下,法律人开始重视海量数据的应用,将数据分析能力作为自身核心能力建设。对法律人而言,如能选择适当的法律大数据分析系统,运用大数据开展法律实证问题研究、商业预测,势必将对法律实务及理论界产生深远影响。

大数据分析二:全国20132014年裁判文书互联网公开情况


2013年全国审结互联网公开的裁判文书总量

2013年审结或执结的总数量(数据来自最高院2014年两会工作报告)

2013年全国裁判文书公开比例

1707733

12956716(包括审结或执结)

13.18%


2014年全国审结互联网公开的裁判文书总量

2014年审结或执结的总数量(数据来自最高院2015年两会工作报告)

2014年全国审结裁判文书公开比例

5110880

13806882(包括审结或执结)

37.02%

图表五


通过大数据分析二,我们发现2014年全国审结裁判文书公开比例为37.02%,远高于2013年的13.18%,我们从数据上可以看出最高院2014年的上网《规定》带来的数量变化。但是我们还应当主要到图表五中红色的部分,2014年大概约有近三分之二的裁判文书没有在互联网公开。对于近三分之二未公开的裁判文书,是不是未公开的案件都属于“涉及国家秘密、个人隐私”、“涉及未成年人违法犯罪”、“调解结案”、“其他不宜互联网公布”五种类型?笔者很期待最高院能够做出相关解释,这些未公开案件数量各地法院是否有义务向社会做出解释?对于兜底条款“其他不宜互联网公布”最高院是否能够做出限缩解释?在大数据技术成熟的今天,最高院如果不对这些问题进行解释,裁判文书公开的可操作性以及司法公信力将大打折扣。


大数据分析三:抽样省域(含直辖市)2013年裁判文书公开情况



省域

2013年审结互联网公开裁判文书数量

2013年审结或执结的总数量(数据来源于各省法院两会工作报告,包括审结或执结)

2013年公开情况

浙江

241742

107.6万件

22.47%

山东

109669

98.17万件

11.17%

江苏

103660

1063965

9.74%

北京

20376

404022

5.04%

广东

91615

100.39万件

9.13%

上海

127283

47.54万件

26.77%

福建

26158

537761

4.86%

安徽

43159

463870

9.30%

河北

80377

534050

15.05%

天津

6540

206436

3.17%

图表六


通过大数据分析三,2013年全国各地区裁判文书的互联网公开比例是13.18%,裁判文书公开的十个热点省域中,只有上海、浙江、河北三个省域的裁判文书公开度高于全国公开度,剩下七个热点省域的公开情况低于全国公开的平均水平。接下来我们看看2014年这些省域裁判文书公开度情况。

大数据分析四:抽样省域(含直辖市)2014年裁判文书公开情况


省域

2014年审结互联网公开裁判文书数量

2014年审结或执结的总数量(数据来源于各省法院两会工作报告,包括审结或执结)

2014年公开情况

浙江

380303

111.9万件

33.99%

山东

413306

103.3万件

40.01%

江苏

496570

1165234

42.62%

北京

92621

448246

20.66%

广东

336113

109.61万件

30.66%

上海

157355

54.5万件

28.87%

福建

291559

537949

54.20%

安徽

276014

541210

51.00%

河北

266089

491975

54.09%

天津

74247

217955

34.07%

图表七


通过大数据分析四,2014年全国各地区裁判文书的互联网公开比例是37.02%裁判文书公开的十个样本省域中已有福建、河北、安徽、江苏、山东五个地区的裁判文书上网情况好于全国公开的平均水平,与2013年的公开情况相比,上海、浙江2014年互联网公开裁判文书情况低于全国公开水平,有些令人诧异。福建从2013年的不到5%的互联网公开率到201454.20%的互联网公开率,可见福建省法院在推进裁判文书互联网公开方面成绩显著,大幅超全国平均水平。此外,关注裁判文书网核心热点地区北京在此份榜单中垫底,公开裁判文书度只有20.66%,令笔者非常意外。由此,笔者联想到了近日在互联网上转发较多的一篇文章《北京市西城区人民法院关于辞去公职的有关要求》,暂且不论这份文档的真实性,这篇文章在北京法律人的微信朋友圈中频频转发,可以北京市法院系统人才流失的趋势才下如此猛药,或许能够从人少事多的角度解释了北京法院在互联网公开裁判文书较少的原因,可喜的是即便北京法院存在人手不足的可能性,但大数据告诉我们北京法院在2014年公开的裁判文书比例已经接近2013年的4倍,笔者相信这对于北京法院系统已经是难能可贵的改革成绩了。


大数据分析五:抽样城市(含直辖市)20132014年裁判文书公开情况



城市

2013年审结互联网公开裁判文书数量

2014年审结互联网公开裁判文书数量

增加比例

北京

20376

92621

354.56%

上海

127283

157355

23.63%

杭州

53817

73724

36.99%

天津

6540

74247

1035.28%

济南

9476

31104

228.24%

广州

16980

57352

237.76%

苏州

8901

61753

593.78%

深圳

21833

54574

149.96%

南京

25422

43273

70.22%

重庆

23916

141726

492.60%

图表八


根据大数据分析五,关注裁判文书网的热点城市中,2014年互联网公开裁判文书比2013年互联网公开裁判文书增加比例最多的城市是天津、第二是苏州、第三是重庆。2014年互联网公开裁判文书数量前三的城市分别为:上海、重庆、北京。天津2014年互联网公布裁判文书增比超过1000%,可见天津法院在2014年相比2013年已经非常重视生效裁判文书公开上网工作,令人印象难忘。


最后,回到我们文中假设的一个问题:“对‘裁判文书网’关注度最高的十个省域,应该是公开情况好于全国平均水平的省域”。从2014年的数据分析来看,这个假设是不成立的,因为十个热点省域有五个省域互联网公开度没有达到全国平均水平,且这些省域还是社会经济较发达区域。从司法改革是一个动态过程来看,这个假设是成立的,因为2013年只有3个省域的公开度达到了全国平均水平,而2014年热点城市中增加到5个达到全国平均标准,且增长势头迅猛,2015年的裁判文书公开度增速依然强劲。如果通过大数据分析对最高院201411日实施的上网《规定》进行量化评估的化,全国各级法院就裁判文书上网公开取得的工作效果比2013年提高了34倍。



原文发布时间为:2015-04-13

本文来自云栖社区合作伙伴“大数据文摘”,了解相关信息可以关注“BigDataDigest”微信公众号

相关实践学习
基于MaxCompute的热门话题分析
本实验围绕社交用户发布的文章做了详尽的分析,通过分析能得到用户群体年龄分布,性别分布,地理位置分布,以及热门话题的热度。
SaaS 模式云数据仓库必修课
本课程由阿里云开发者社区和阿里云大数据团队共同出品,是SaaS模式云原生数据仓库领导者MaxCompute核心课程。本课程由阿里云资深产品和技术专家们从概念到方法,从场景到实践,体系化的将阿里巴巴飞天大数据平台10多年的经过验证的方法与实践深入浅出的讲给开发者们。帮助大数据开发者快速了解并掌握SaaS模式的云原生的数据仓库,助力开发者学习了解先进的技术栈,并能在实际业务中敏捷的进行大数据分析,赋能企业业务。 通过本课程可以了解SaaS模式云原生数据仓库领导者MaxCompute核心功能及典型适用场景,可应用MaxCompute实现数仓搭建,快速进行大数据分析。适合大数据工程师、大数据分析师 大量数据需要处理、存储和管理,需要搭建数据仓库?学它! 没有足够人员和经验来运维大数据平台,不想自建IDC买机器,需要免运维的大数据平台?会SQL就等于会大数据?学它! 想知道大数据用得对不对,想用更少的钱得到持续演进的数仓能力?获得极致弹性的计算资源和更好的性能,以及持续保护数据安全的生产环境?学它! 想要获得灵活的分析能力,快速洞察数据规律特征?想要兼得数据湖的灵活性与数据仓库的成长性?学它! 出品人:阿里云大数据产品及研发团队专家 产品 MaxCompute 官网 https://www.aliyun.com/product/odps 
相关文章
|
大数据
《重磅发布!300页阿里巴巴大数据核心技术公开,速度收藏》电子版地址
重磅发布!阿里巴巴大数据团队历时一年,集合25+专家协力打造《像阿里巴巴一样玩转大数据》系列电子书,近300页实战精华。
146 0
《重磅发布!300页阿里巴巴大数据核心技术公开,速度收藏》电子版地址
|
大数据
《重磅发布!300页阿里巴巴大数据核心技术公开,速度收藏》电子版下载地址
重磅发布!阿里巴巴大数据团队历时一年,集合25+专家协力打造《像阿里巴巴一样玩转大数据》系列电子书,近300页实战精华。
137 0
《重磅发布!300页阿里巴巴大数据核心技术公开,速度收藏》电子版下载地址
|
新零售 大数据 物联网
重磅发布!300页阿里巴巴大数据核心技术公开,速度收藏
重磅发布!阿里巴巴大数据团队历时一年,集合25+专家协力打造《像阿里巴巴一样玩转大数据》系列电子书,近300页实战精华。
64987 1
重磅发布!300页阿里巴巴大数据核心技术公开,速度收藏
|
分布式计算 算法 大数据
那些年Google公开的大数据领域论文
      摘要:Google于2004年公布了MapReduce论文,为数据领域工作者开启了大数据算法之门。然而Google的大数据脚步显然不止于此,其后公布了Percolator、Pregel、Dremel、Spanner等多篇论文。
1615 0

热门文章

最新文章

下一篇
无影云桌面