法律大数据专题文章计划:
《大数据解读2014年中国裁判文书公开》为本次系列文章的主题,本文通过业界成熟大数据技术,希望对公开裁判文书分析、统计,从而对裁判文书公开情况量化评估。本系列文章具有尝试研究性质,文章的数据全部来自互联网全网公开数据,所得结论仅用于研究讨论目的,本文的评价依据均来自数据,不代表本文作者及作者所在机构立场。
本文为之(一),主要内容是对2014年全国及关注热点地区的裁判文书总体公开效果进行量化分析;专题之(二)通过大数据分析2014年全国民事案件的公开情况;专题之(三)通过大数据分析2014年全国刑事案件公开情况;专题之(四)通过大数据分析2014年全国行政及国家赔偿案件公开情况;专题之(五)通过大数据分析2014年最高院诉讼案件的公开情况。为确保每篇文章经典、数据完整性和真实性,每一到两周推出一篇法律大数据专题文章,敬请读者期待!
在笔者热衷讨论法律大数据的朋友群中,“大数据”与最高院“裁判文书网”是密切相关的两个关键字。利用百度指数对检索关键词的分析(图表一),我们注意到,互联网用户对大数据的关注更早,并且关注用户人数明显多于裁判文书网关注用户。用户对裁判文书网的关注水平,2014年3月春节结束之后的关注度保持稳定上升平稳。两相比较可见,用户对大数据的关注波动情况要高于对裁判文书网关注的波动,对裁判文书网的关注相对平稳增长,笔者猜测用户对大数据的关注度受市场因素影响,而用户对裁判文书网的关注则受国家司法政策因素影响较多。
图表一:“大数据”与“裁判文书网”的关注对比
裁判文书在互联网公开是2014年司法公开改革的重要风向标。2014年1月1日,《最高人民法院关于人民法院在互联网公布裁判文书的规定》(下称《规定》)的实施,标志着由最高院在全国的范围内统一组织裁判文书网上公开工作。值得注意的是,该《规定》第四条明确了除“涉及国家秘密、个人隐私”、“涉及未成年人违法犯罪”、“调解结案”、“其他不宜互联网公布”的五种裁判文书外,人民法院的生效裁判文书应当在互联网公布。而早在2010年的10月,最高人民法院《关于人民法院在互联网公布裁判文书的规定》第二条规定“人民法院的生效裁判文书可以在互联网公布”,相比2014年《规定》赋予了诉讼当事人更申请不公开的权利―“当事人明确请求不在互联网公布并有正当理由,且不涉及公共利益的”。
不同时期的两份最高院关于裁判文书互联网公开规定相对比,我们清晰看出2014年以前裁判文书公开赋予了法官、当事人宽泛的上网公开选择权利,而2014年的上网《规定》则更加体现了没有例外情形下,一律要求在互联网公开的司法改革理念。如今,2014年最高院上网《规定》已经颁布一年有余,具体实施情况如何?本文将通过大数据分析方法,对比2013年和2014年在互联网公开的全部裁判文书,在维度上横向跨地域、纵向跨时间对全国及热点地区的司法公开情况进行大数据实证研究,完全依据数据对最高院2014年上网《规定》的实施效果量化评估。为了更贴近实际情况避免主观判断,我们选取量化分析的省域均为对裁判文书公开关注热点省域,即选取来自百度指数对“裁判文书网”关注度最高的十大省域(含直辖市)。
图表二:关注裁判文书网的热点城市分布
互联网用户对于“裁判文书网”的关注热点地区,在中国地图上主要分布在沿海经济发达地区,以及国家区域中心城市,通过数据可视化图表二、三的展示,此结论没有太多意外比较符合直觉判断:经济活动发达地区的司法公开关注度往往更高。从关注“裁判文书网”的城市群体中来看,长江流域省会城市的用户普遍关注裁判文书网,而来自北京的用户则是关注裁判文书网程度最高的用户群体。从区域间的社会分工协作来看,司法权力行使的中心与大数据行业领军企业、人才在北京重合,我们有理由相信随着司法公开的推进,法律大数据将成为法律服务市场的朝阳产业,颠覆性的法律大数据创意将很可能出现在北京。
图表三:关注裁判文书网的热点省域(含直辖市)分布
2014年1月至今最为关注“裁判文书网”的热点省域(含直辖市),是我们大数据评价裁判文书公开情况的目标样本区域,考虑到本文分析的大部分省域是司法改革的重点推进区域,通过大数据分析这些省域的公开情况,可在全样本统计意义上可对最高院2014年裁判文书上网《规定》的实际效果进行量化评估。但需提请注意的是,这些省域互联网用户对裁判文书网的关注度较高,并不一定意味着裁判文书公开情况最好(但是值得观察的问题),本文通过大数据测评裁判文书公开情况的目的在于回答:“互联网用户对于“裁判文书网”关注度是否与公开实际情况成正比?”在此我们首先假定:“对‘裁判文书网’关注度最高的十个省域,应该是公开情况好于全国平均水平的省域”,接下来我们将通过大数据分析验证此假定是否成立。
大数据分析一:全国2013、2014年裁判文书公开情况
区域 |
2013年审结互联网公开裁判文书数量 |
2014年审结互联网公开裁判文书数量 |
全国 |
1707733 |
5110880 |
图表四
通过大数据分析一,我们发现2014年审结互联网公开的裁判文书显著增长,接近2013年互联网公开数量的3倍,通过对互联网全部公开裁判文书分析,本文的数据分析除了最高院在裁判文书网公开的数据,还包括散落在各省高院、各地中院、专门法院、各县人民法院的裁判文书发布平台数据。通过全网数据比较,2014年全网公布的裁判文书量,在最高院上网《规定》作用下,相比2013年互联网公布量出现了指数性增长,并在2015年保持公开裁判文书快速增长,此外近期互联网公开的刑事起诉书数量显著增长也引起了笔者的注意。从裁判文书公开数量的意义来看,法院系统对于裁判文书的上网公开比以往改善了三倍以上,公开数据量呈现指数增长趋势已初现端倪。很多法律人意识到法律大数据的时代已经到了,在大数据分析、司法公开改革双重合的社会思潮下,法律人开始重视海量数据的应用,将数据分析能力作为自身核心能力建设。对法律人而言,如能选择适当的法律大数据分析系统,运用大数据开展法律实证问题研究、商业预测,势必将对法律实务及理论界产生深远影响。
大数据分析二:全国2013、2014年裁判文书互联网公开情况
2013年全国审结互联网公开的裁判文书总量 |
2013年审结或执结的总数量(数据来自最高院2014年两会工作报告) |
2013年全国裁判文书公开比例 |
1707733 |
12956716(包括审结或执结) |
13.18% |
2014年全国审结互联网公开的裁判文书总量 |
2014年审结或执结的总数量(数据来自最高院2015年两会工作报告) |
2014年全国审结裁判文书公开比例 |
5110880 |
13806882(包括审结或执结) |
37.02% |
图表五
通过大数据分析二,我们发现2014年全国审结裁判文书公开比例为37.02%,远高于2013年的13.18%,我们从数据上可以看出最高院2014年的上网《规定》带来的数量变化。但是我们还应当主要到图表五中红色的部分,2014年大概约有近三分之二的裁判文书没有在互联网公开。对于近三分之二未公开的裁判文书,是不是未公开的案件都属于“涉及国家秘密、个人隐私”、“涉及未成年人违法犯罪”、“调解结案”、“其他不宜互联网公布”五种类型?笔者很期待最高院能够做出相关解释,这些未公开案件数量各地法院是否有义务向社会做出解释?对于兜底条款“其他不宜互联网公布”最高院是否能够做出限缩解释?在大数据技术成熟的今天,最高院如果不对这些问题进行解释,裁判文书公开的可操作性以及司法公信力将大打折扣。
大数据分析三:抽样省域(含直辖市)2013年裁判文书公开情况
省域 |
2013年审结互联网公开裁判文书数量 |
2013年审结或执结的总数量(数据来源于各省法院两会工作报告,包括审结或执结) |
2013年公开情况 |
浙江 |
241742 |
107.6万件 |
22.47% |
山东 |
109669 |
98.17万件 |
11.17% |
江苏 |
103660 |
1063965件 |
9.74% |
北京 |
20376 |
404022件 |
5.04% |
广东 |
91615 |
100.39万件 |
9.13% |
上海 |
127283 |
47.54万件 |
26.77% |
福建 |
26158 |
537761件 |
4.86% |
安徽 |
43159 |
463870件 |
9.30% |
河北 |
80377 |
534050件 |
15.05% |
天津 |
6540 |
206436件 |
3.17% |
图表六
通过大数据分析三,2013年全国各地区裁判文书的互联网公开比例是13.18%,裁判文书公开的十个热点省域中,只有上海、浙江、河北三个省域的裁判文书公开度高于全国公开度,剩下七个热点省域的公开情况低于全国公开的平均水平。接下来我们看看2014年这些省域裁判文书公开度情况。
大数据分析四:抽样省域(含直辖市)2014年裁判文书公开情况
省域 |
2014年审结互联网公开裁判文书数量 |
2014年审结或执结的总数量(数据来源于各省法院两会工作报告,包括审结或执结) |
2014年公开情况 |
浙江 |
380303 |
111.9万件 |
33.99% |
山东 |
413306 |
103.3万件 |
40.01% |
江苏 |
496570 |
1165234件 |
42.62% |
北京 |
92621 |
448246件 |
20.66% |
广东 |
336113 |
109.61万件 |
30.66% |
上海 |
157355 |
54.5万件 |
28.87% |
福建 |
291559 |
537949件 |
54.20% |
安徽 |
276014 |
541210件 |
51.00% |
河北 |
266089 |
491975件 |
54.09% |
天津 |
74247 |
217955件 |
34.07% |
图表七
通过大数据分析四,2014年全国各地区裁判文书的互联网公开比例是37.02%,裁判文书公开的十个样本省域中已有福建、河北、安徽、江苏、山东五个地区的裁判文书上网情况好于全国公开的平均水平,与2013年的公开情况相比,上海、浙江2014年互联网公开裁判文书情况低于全国公开水平,有些令人诧异。福建从2013年的不到5%的互联网公开率到2014年54.20%的互联网公开率,可见福建省法院在推进裁判文书互联网公开方面成绩显著,大幅超全国平均水平。此外,关注裁判文书网核心热点地区北京在此份榜单中垫底,公开裁判文书度只有20.66%,令笔者非常意外。由此,笔者联想到了近日在互联网上转发较多的一篇文章《北京市西城区人民法院关于辞去公职的有关要求》,暂且不论这份文档的真实性,这篇文章在北京法律人的微信朋友圈中频频转发,可以北京市法院系统人才流失的趋势才下如此猛药,或许能够从人少事多的角度解释了北京法院在互联网公开裁判文书较少的原因,可喜的是即便北京法院存在人手不足的可能性,但大数据告诉我们北京法院在2014年公开的裁判文书比例已经接近2013年的4倍,笔者相信这对于北京法院系统已经是难能可贵的改革成绩了。
大数据分析五:抽样城市(含直辖市)2013、2014年裁判文书公开情况
城市 |
2013年审结互联网公开裁判文书数量 |
2014年审结互联网公开裁判文书数量 |
增加比例 |
北京 |
20376 |
92621 |
354.56% |
上海 |
127283 |
157355 |
23.63% |
杭州 |
53817 |
73724 |
36.99% |
天津 |
6540 |
74247 |
1035.28% |
济南 |
9476 |
31104 |
228.24% |
广州 |
16980 |
57352 |
237.76% |
苏州 |
8901 |
61753 |
593.78% |
深圳 |
21833 |
54574 |
149.96% |
南京 |
25422 |
43273 |
70.22% |
重庆 |
23916 |
141726 |
492.60% |
图表八
根据大数据分析五,关注裁判文书网的热点城市中,2014年互联网公开裁判文书比2013年互联网公开裁判文书增加比例最多的城市是天津、第二是苏州、第三是重庆。2014年互联网公开裁判文书数量前三的城市分别为:上海、重庆、北京。天津2014年互联网公布裁判文书增比超过1000%,可见天津法院在2014年相比2013年已经非常重视生效裁判文书公开上网工作,令人印象难忘。
最后,回到我们文中假设的一个问题:“对‘裁判文书网’关注度最高的十个省域,应该是公开情况好于全国平均水平的省域”。从2014年的数据分析来看,这个假设是不成立的,因为十个热点省域有五个省域互联网公开度没有达到全国平均水平,且这些省域还是社会经济较发达区域。从司法改革是一个动态过程来看,这个假设是成立的,因为2013年只有3个省域的公开度达到了全国平均水平,而2014年热点城市中增加到5个达到全国平均标准,且增长势头迅猛,2015年的裁判文书公开度增速依然强劲。如果通过大数据分析对最高院2014年1月1日实施的上网《规定》进行量化评估的化,全国各级法院就裁判文书上网公开取得的工作效果比2013年提高了3至4倍。
原文发布时间为:2015-04-13
本文来自云栖社区合作伙伴“大数据文摘”,了解相关信息可以关注“BigDataDigest”微信公众号