【数据说话】当下的Python就业前景如何

简介: 以上便是我们做的一些微小工作,希望能给大家带来些帮助。当然,本案例中所有数据来自上述招聘网站的公开数据,与真实的市场需求有可能存在偏差,仅供参考。

Python 现在是越来越火了。


IEEE 发布的 2017 年编程语言排行榜,Python 排第一。



百度指数的搜索趋势,Python稳步上升。


(此趋势图上有个小亮点:那些搜索量骤减的极低值,猜猜都是为什么?)


那么对于很多学习者来说,紧跟潮流学了 Python 之后,不免要问:Python 的就业情况到底怎样?学了可以做什么?薪资水平如何?


这个问题,我说了不算数。对就业市场最有发言权的还是招聘网站。既然 Python 是数据分析的利器,何不用就用 Python 来问一问招聘网站,让数据来说话。


于是,我们团队的小伙伴用程序抓取了 拉钩、猎聘、前程无忧、智联招聘 4家网站上在 2017 年 8 月到 9 月关于 Python 的 19011 条公开招聘信息,对数据进行了整理分析,并将结果进行图表展示。从中可以对当下的 Python 就业市场有一个直观的了解。


(展示网址和项目代码说明在文末附上)


来看看最终的结论:



首先是大家最关心的薪资。我们列出了十个城市,薪资与工作年限的分布图。不同城市的情况差异较大,总的来说城市越大,薪资越有竞争力,对高级开发者需求也越大。详细分布图可以在展示网址上查看。



同样还是薪资,这幅图更直观地展示了需求职位数量的分布情况。北上深明显有更多机会。折线都呈现出了双峰形状,市场对于有一定经验的开发者和高级开发者这两类人才有强烈需求。



这里是我们从招聘岗位要求中提取出的关键词。不少同学都关心,学了 Python 基础之后还要再学习什么。其实招聘要求就是一个很好的风向标。除了基本的 Python 语言外,可以发现 Linux、数据库也是经常被提及的技能,同时最好还能掌握另一门语言(比如 Java)。



招聘方的公司规模,50~1000 人的中小型公司占据了大多数,不过这个数量级的公司本身就相对更多。在没有进一步对比的情况下,不好下结论说哪个规模的公司更偏爱 Python。但 Python 本身的灵活性使其开发效率更高,确实更适合中小型的公司。



具体细分岗位和薪水、年限的关系。这里我们根据招聘里的关键词,将岗位分成 数据分析、运维、web、爬虫、游戏、深度学习 几类。目前 Web 和运维方向仍然是 Python 的主要出路,数据分析也有不少机会。但运维对工作经验要求相对更高,初级开发者倒是可以考虑从爬虫方向入行。



在地图上直观地看下招聘的地区分布,北上广深附近不出意外的聚集了大量红点。而成都、西安也有不少,不失为另一种选择。


以上便是我们做的一些微小工作,希望能给大家带来些帮助。当然,本案例中所有数据来自上述招聘网站的公开数据,与真实的市场需求有可能存在偏差,仅供参考。


另外要特别说明下,我们在分析的过程中,发现招聘网站上有不少名为招聘、实为招生的培训机构,因此我们根据观察和经验,去除了一部分疑似培训岗位。各位在求职时,也要对此多留个心眼,以免上当受骗。有网友整理了一份相关公司黑名单,可由此查看:blacklist.yitu.yt


此案例我们通过 Scrapy + Django + ECharts 实现:


  1. 通过 Scrapy 抓取网站上的数据,整理清洗后保存在数据库中。这里我们使用了 scrapy_djangoitem 库,直接使用 django 的 models 对象来进行数据存储。
  2. 在抓取中,使用了我们之前的项目 IP 代理池(参见 听说你好不容易写了个爬虫,结果没抓几个就被封了?)来动态切换请求 IP,减少被对方封禁的风险。
  3. 最后的结果通过 ECharts 进行展示。(参见 ECharts+Python 给你的数据做“美颜”


点击 阅读原文 可查看数据展示页面(建议电脑上查看)。


  • 代码问题请在论坛 bbs.crossincode.com 上发帖提问
  • 欢迎加入讨论交流群组共同学习进步
  • 别忘了将我们的文章转发朋友圈或在知乎上为我们的专栏点赞,你们的支持将会让编程教室做得更好:)


近期文章推荐阅读:

Python有嘻哈:Crossin教你用代码写出押韵的verse

编程新手:看懂很多示例,却依然写不好一个程序

喏,你们要的 PyCharm 快速上手指南

给伸手党的福利:Python 新手引导

数据分析:当赵雷唱民谣时他唱些什么?

Python 爬虫爬取美剧网站

爆款游戏《贪吃蛇大作战》的 Python 实现

相关文章
|
8天前
|
数据处理 Python
如何使用Python的Pandas库进行数据排序和排名
【4月更文挑战第22天】Pandas Python库提供数据排序和排名功能。使用`sort_values()`按列进行升序或降序排序,如`df.sort_values(by='A', ascending=False)`。`rank()`函数用于计算排名,如`df['A'].rank(ascending=False)`。多列操作可传入列名列表,如`df.sort_values(by=['A', 'B'], ascending=[True, False])`和分别对'A'、'B'列排名。
23 2
|
7天前
|
机器学习/深度学习 数据挖掘 网络架构
Python对商店数据进行lstm和xgboost销售量时间序列建模预测分析
Python对商店数据进行lstm和xgboost销售量时间序列建模预测分析
18 0
|
7天前
|
机器学习/深度学习 算法 数据挖掘
PYTHON银行机器学习:回归、随机森林、KNN近邻、决策树、高斯朴素贝叶斯、支持向量机SVM分析营销活动数据|数据分享-2
PYTHON银行机器学习:回归、随机森林、KNN近邻、决策树、高斯朴素贝叶斯、支持向量机SVM分析营销活动数据|数据分享
28 1
|
5天前
|
机器学习/深度学习 存储 监控
数据分享|Python卷积神经网络CNN身份识别图像处理在疫情防控下口罩识别、人脸识别
数据分享|Python卷积神经网络CNN身份识别图像处理在疫情防控下口罩识别、人脸识别
13 0
|
7天前
|
机器学习/深度学习 算法 算法框架/工具
数据分享|PYTHON用KERAS的LSTM神经网络进行时间序列预测天然气价格例子
数据分享|PYTHON用KERAS的LSTM神经网络进行时间序列预测天然气价格例子
26 0
|
1天前
|
数据采集 关系型数据库 BI
Python路面平整度检测车辆数据——速度修正
Python路面平整度检测车辆数据——速度修正
|
3天前
|
新零售 分布式计算 数据可视化
数据分享|基于Python、Hadoop零售交易数据的Spark数据处理与Echarts可视化分析
数据分享|基于Python、Hadoop零售交易数据的Spark数据处理与Echarts可视化分析
14 0
|
4天前
|
JSON 数据挖掘 数据库
Python复合型数据避坑指南
Python复合型数据避坑指南
13 3
|
5天前
|
机器学习/深度学习 数据采集 算法
Python信贷风控模型:Adaboost,XGBoost,SGD, SVC,随机森林, KNN预测信贷违约支付|数据分享
Python信贷风控模型:Adaboost,XGBoost,SGD, SVC,随机森林, KNN预测信贷违约支付|数据分享
10 1
Python信贷风控模型:Adaboost,XGBoost,SGD, SVC,随机森林, KNN预测信贷违约支付|数据分享
|
5天前
|
JSON 数据可视化 定位技术
python_将包含汉字的字典数据写入json(将datav的全省数据中的贵州区域数据取出来)
python_将包含汉字的字典数据写入json(将datav的全省数据中的贵州区域数据取出来)
11 0