大数据告诉你要不要当公务员?

本文涉及的产品
云原生大数据计算服务 MaxCompute,5000CU*H 100GB 3个月
云原生大数据计算服务MaxCompute,500CU*H 100GB 3个月
简介:

大清早,学姐就推开我寝室的门,说道:“我妈又打电话催我要准备国考了。”

没错,这就是最近学姐和我之间的主要话题。什么考公务员考到哪里啦,公务员工资高不高啦,工作是不是很轻松啦。其实我觉得这些都不是什么重要因素。收入?轻松?还要考虑这些事?难道当一名光荣的公务员的主要原因不应当是希望自己能够鞠躬尽瘁死而后已地致力于为人民服务的伟大事业吗?

当然,这些话我并未出口,大清早的我实在不想再被学姐打了。但为了结束这个絮絮叨叨的话题,我还是决定帮助她研究这么一个小问题:

学姐啊,公务员收入什么的我实在搞不清楚,但我们不妨来看看:当一名光荣的公务员,到底有多辛苦呢?

假如只是四处打听一下的话,会发现关于公务员的消息往往都是两极分化的。城市公共部门工作的小伙伴们总是有的忙碌有的闲。毫无疑问,个体的遭遇总是剧情离奇且难以预料的。但是总体情况如何呢?

就全国而言太过复杂,还是以魔都为例吧。我们登录上海市人民政府的官方网站,可以看到魔都政府已经非常贴心地把各级各类的城市公共部门信息都公布在了网站上,另加基层一线的上海所有镇级人民政府,我们把这些部门(共计704个)整理下来,按照类型和级别把它们放在地图上,可以看到下图:

那么,我们可以简单地将在这700多个公共部门工作的人,视为上海的主要公务员群体。那么,他们总体工作状态怎样呢?

事实上,我们没有办法去查看每个部门的打卡机,通过精确的出勤信息做出精准的分析。但非常恰巧的是,我的电脑正好放着一组来自某互联网公司(见注1)的关于上海的移动设备源大样本数据(约300万个源吧)。太好了,让我们用这组数据作为一个抽样,来挖掘一下魔都公共部门的工作状况吧。

第一步,我们需要定义这些公共部门在法定时间内的工作状态

假设,这些公共部门的公务员们会认真地且相对固定地于8:00至18:00期间在办公室上班,那么,我们则需要找到每个办公地点里在以上时段内高频度出现的移动设备源即可。而这些移动源的集聚状况在某种意义上代表了该部门的法定时间工作状况((根据地址频度显著性、分时段地址差异性等各项指标,从300万个样本中共筛出来质量较高的约2万个样本是落在704栋办公楼的空间范围内的)。我们将移动源按位置汇总到各个单位,画出图来后大概长这样。

从上图中我们可以看到,工作人员规模最大的公共部门均分布在内环线以内,其中浦东新区和徐汇区的若干公共部门在工作人员总数量上遥遥领先,甚至超过了人民广场。而这些只是白天法定时段内的工作状况。

第二步,我们需要定义这些公共部门在法定时间之外的工作状态


假如某单位工作异常繁重,而领导的爱好则是快下班时过来说,“小团啊,这个文件你写一下我明天早上要。”为了满足领导的爱好,可怜的公务员下了班之后往往不能直接回家,经常还得在18:00到22:00这个期间仍然继续鞠躬尽瘁地在办公室里加班。

基于以上假设,为了描绘出公共部门在法定时间之外的工作状态(其实就是加班状况),我们需要从以上数据中再一次筛选出以上时段内(18:00至22:00)仍然在工作地点高频出现的移动源。筛选完这些数据(差不多剩下8000个样本),将其汇总到部门后,画出图来大概长这样:

可以看到,加班总人数的分布和工作总人数分布基本相符。浦东与徐汇仍然领先,而人民广场附近也逐渐追赶上来。具体观察的话,在法定工作时间之外高频度移动源聚集量最大的部门是(冠军来了):

浦东新区地方税务局

看,我们纳税纳得连收税的都得加班加点了。

但是,我们需要注意到的是,加班人员总量(法定时间之外的)并不能完全反应该部门的忙碌程度,也许这个部门本来就人多呢。因此,相对真实地反应该部门的加班状况,我们还需要第三步。

好的,第三步来了,我们来计算不同公共部门的加班人员占比


很简单,我们将第一步和第二步的分别筛选出的两组数据相除,就可以得到每个部门的加班人员占比,汇总到各部门可以画出下图:

可以看到,市中心高高的红色柱子消失了,它们在郊区零零星星地长了出来。

的确,虽然郊区公共部门的加班工作人员总量与市中心不可比拟,但是其加班人员的比例还是相当高的,而市中心某些地区甚至出现了塌陷。这是怎么回事呢?

这时候,学姐打断我的分析和思考,问道:“会不会是这些郊区的工作人员下了班之后赖在办公室不走喝茶聊天打牌呢?反正我们老家的公务员很多都是这样的,都是五点下班但赖到七八点才回家或者去外面吃饭。”

的确,以我们所能掌握的数据是无法完全排除这个可能的。但是,魔都与一般小城市的差别在于上下班回家的通勤时间天壤之别,以魔都平均通勤时间来计算的话,假如赖到七八点才走,那晚饭就很难指望,估计回到家洗洗弄弄就只能吃宵夜了。
因此,本着关怀的精神,让我们再增加一个步骤。

第四步,验证一下看看,这些加班的公务员们,他们都住得离家远吗?


假设,在领导第二天要看文件的强烈需求下,公务员们虽然很努力地加班,但是不至于总是干通宵啊,一个礼拜也得有个三五天回家睡觉吧,当然睡觉时间可能不会很长,差不多也就是24:00至6:00期间吧。

基于这个假设,我们需要找到步骤二中筛选出的那些移动源在以上时段(24:00至6:00)内高频出现的地点,并将之视为该工作人员的居住点。然后将这些点与工作部门所在地进行连线,便可以画出一张加班人员通勤图:

上图中的红点,标示相应的公共部门所在地;而绿线,则表示加班的公务员回家的通勤方向与通勤距离。

可以看到,分布在远郊的红点们,其中很多的通勤连线都紧紧地联系着市中心,有些甚至是长途跋涉,比如金山、临港等地区。可以这么理解:对于某些在郊区工作的公务员来说,假如一不小心在办公室赖了以后,那他们这天其实也不太用考虑回家这件事了。

学姐忍不住问道:“郊区的公务员真的都住的那么远吗?还是这只是个别现象? ”

我们可以将以上结论做一个分区的统计,请看下图:

从通勤角度来看,的确,大部分市区的加班公务员通勤距离差异不大,保持在8公里左右。但是郊区加班公务员的通勤则差异极大。比如,嘉定、松江、青浦和奉贤,在这四个传统区县里,加班公务员的通勤距离非常短,仅有5公里,估计很多都是本地解决。但对于金山和崇明而言,则达到了12公里以上。

但从加班指数(加班人员占比)上看,每个区也均有不同。可以看到,公务员加班指数排名最高的三个区分别为静安、崇明、和杨浦。加班比例达到了35%(崇明又加班路又远到底是有多惨)。而相对比较轻松的则是金山、嘉定和普陀,其加班比例略低,但也有20%以上。

我愉快地做完了这个分析,试图结束这个话题。但学姐又发话了,“考公务员的话,貌似不是按片考的吧,是按部门吧。”

啊,好像真的是这样(我真的应该认真去看一下公务员考试指南了)。那么好的,让我们按照公共部门的类型整理一下分析结果吧(只包括了按照官网分类标准能够准确分类的,无法准确分类的被我无情地剔除了,对的我就是这么任性),请看下图:

可以看到,加班指数最高的公共部门分别是城市规划部门、其次是人民政府和公安系统。依次排序下来,则是税务、财政、发改。

以上六类虽然通勤距离各有差异,但是加班指数均达到了30%。而相对较为舒适的公共部门看起来是交通系统啊,加班指数最低(约25%),而通勤距离也最短(3公里)。

我若有所思地自言自语道:看来我要劝告那些学城市规划的弟弟妹妹们,赶紧转行学城市交通了才对啊。

这时,学姐第三次发话了,“我觉得你这么分析还是不科学啊。难道区规划局和市规划局、区政府和市政府的加班、国税局和地税局的工作模式一样吗?同一个部门内部可是差异极大的啊。”

学姐真是难缠啊。好吧,让我再次将这些公共部门按照等级分类,分级到市、区、镇三级(魔都基本上没有国家级部门,有少数几个被我无情地剔除掉了,对的我就是这么任性)。请看下图:

额。这个规律也有点过于明显了吧。

我赶紧指着屏幕说道,“喂,学姐你看。市级部门的公务员平均加班比率最低,不到30%,通勤距离也比较短;而镇级加班率最高,通勤更是达到了9.5公里。。。哎,学姐你看啊。”

学姐没有搭腔,我转过头来,发现她已经把手机贴到了耳边,并对我做了一个嘘的手势,我赶紧闭上了嘴。隐隐听到她手机听筒里嘟了两声之后传来接通的声音,然后她赶忙急匆匆地问道:

“喂,妈,你在市里面有人吗?”


本文作者:佚名

来源:51CTO

相关实践学习
基于MaxCompute的热门话题分析
本实验围绕社交用户发布的文章做了详尽的分析,通过分析能得到用户群体年龄分布,性别分布,地理位置分布,以及热门话题的热度。
SaaS 模式云数据仓库必修课
本课程由阿里云开发者社区和阿里云大数据团队共同出品,是SaaS模式云原生数据仓库领导者MaxCompute核心课程。本课程由阿里云资深产品和技术专家们从概念到方法,从场景到实践,体系化的将阿里巴巴飞天大数据平台10多年的经过验证的方法与实践深入浅出的讲给开发者们。帮助大数据开发者快速了解并掌握SaaS模式的云原生的数据仓库,助力开发者学习了解先进的技术栈,并能在实际业务中敏捷的进行大数据分析,赋能企业业务。 通过本课程可以了解SaaS模式云原生数据仓库领导者MaxCompute核心功能及典型适用场景,可应用MaxCompute实现数仓搭建,快速进行大数据分析。适合大数据工程师、大数据分析师 大量数据需要处理、存储和管理,需要搭建数据仓库?学它! 没有足够人员和经验来运维大数据平台,不想自建IDC买机器,需要免运维的大数据平台?会SQL就等于会大数据?学它! 想知道大数据用得对不对,想用更少的钱得到持续演进的数仓能力?获得极致弹性的计算资源和更好的性能,以及持续保护数据安全的生产环境?学它! 想要获得灵活的分析能力,快速洞察数据规律特征?想要兼得数据湖的灵活性与数据仓库的成长性?学它! 出品人:阿里云大数据产品及研发团队专家 产品 MaxCompute 官网 https://www.aliyun.com/product/odps 
相关文章
|
算法 Java 大数据
大数据分析技术 大数据就业待遇如何?
大数据是眼下非常时髦的热词,同时也催生出了一些与大数据处理相关的职业,通过对数据的挖掘分析来影响企业的商业决策。随着大数据在国内的发展,大数据相关人才却出现了供不应求的状况,大数据分析师更是被媒体称为“未来最具发展潜力的职业之一”。
1900 0
|
大数据
你是如何被“大数据”洗脑的?
在这个大数据盛行的时代,到底是应该相信常识还是相信时代呢?
1922 0