「一行分析」利用12000条招聘数据分析Python学习方向和就业方向

简介: 选择大于努力,已经成为一个无可否认的事实。就像当年高几十分考上985生物专业的同学和考上211计算机专业的同学,毕业的薪资出现明显的反差;又或者同是生物专业,一位考雅思出国读硕士和一位自学python转行的同学,两年后的薪资也具有明显的反差



本文献给准备找工作和准备转行的你

选择大于努力,已经成为一个无可否认的事实。就像当年高几十分考上985生物专业的同学和考上211计算机专业的同学,毕业的薪资出现明显的反差;又或者同是生物专业,一位考雅思出国读硕士和一位自学python转行的同学,两年后的薪资也具有明显的反差(有些专业不见得出国回来就能够有很大差距)。

出现这种情况也是因为对行业整体的不了解,盲人摸象般的选择,才一次又一次选择夕阳专业、夕阳行业、夕阳工资。不得不说行哥也是在读研时期碰巧自学了Python,才能利用技术在还没毕业就攒到10w+的存款。本篇行哥希望能够利用Python技术给大家在对Python做相关选择时提供一个有用的参考

如果说Python是一棵技能树,那么初学Python的时候就需要我们为这棵技能树选择增加天赋和技能点。但是天赋的选择又很多,例如数据分析,人工智能,爬虫,网络等天赋需要增加,很多人在学习python这个技能树上都不知道该怎么加点,一通乱点导致技能树加点加歪了都有可能,究其原因都是因为我们只是想学Python找一份工作,但是不知道能找什么行业(大部分人以为学编程就是去互联网行业)和找什么岗位,所以才到埋头苦学或者听一大堆教育机构狂轰滥炸的广告去加技能点,学完发现Python4.0都出来了还没找到心意的工作

所以今天行哥拿到51job招聘网站的12000条招聘数据,想要全套爬虫代码和招聘数据可以从我的公众号【一行数据】后台回复【一行02】进行获取哦,爬取了全国范围内大数据、数据分析、数据挖掘、机器学习、人工智能等相关岗位的招聘信息,在这以结果来倒推最优工作的选择,说人话就是画图来看钱多事少离家近的工作

这篇分析只解决四个问题:

   如何选择Python方向

   如何选择就业岗位

   如何选择就业城市

   如何选择就业行业

解答这些问题

选择方向:哪个岗位工资最高?

【哪个岗位工资最高?】其实这个问题不是很严谨,因为每个人对工资的关注点不一样。关注点主要有工资下限高(意味可接受程度),工资上限高(意味着未来发展),工资平均值高(小心被是被马云给平均了),工资中位数高(只要打败50%的竞争者就可以获得的待遇)。所以行哥对全国招聘数量前20的岗位的薪资做了一个分析,并以工资平均值的高低从左至右进行排序

image.png

我们看到毫无疑问这几年最火的人工智能&数据挖掘的平均工资是最高的底薪也高,那么对应的门槛就很高,据今年校招所了解,投递大厂这个岗位的基本要求是硕士+顶刊论文(特别优秀的本科生除外)。所以想挑战高底薪的同学可以尝试学习这个方向,不然直接建议曲线救国,通过学会人工智能来投递数据分析岗(排在第12位),因为学习人工智能的难度和就业人工智能的难度是两个级别

之后有意思的是运营这个岗位,这个岗位相当于技术派的销售,属于门槛低底薪低但是上限非常非常高的一个岗位,方差极大,别的岗位的薪资分布为二八定律,但是运营岗工资的分布基本就是一九定律。有想法的读者可以学习Python的爬虫和数据分析,掌握获取数据的能力和数据分析的思维,来尝试这个岗位非常不错。当然这个运营岗包括数据运营,社群运营,用户运营,增长运营,新媒体运营等等等,想了解的小伙伴可以点个在看,我下次来介绍怎么从零进入运营岗

排在运营之后的网络工程师,质量工程师,技术支持工程师,软件实施工程师,低底薪低上限,没有实际参与过,不做过多评价(手动狗头)

选择岗位:哪一个岗位的招聘数量最多?

既然了解了每个岗位的工资情况,那么什么样的岗位性价比最高呢,我将每个岗位的招聘数量和岗位的平均工资画了一个图,当岗位数量*10/平均工资数量大于1的时候,我们可以从图中发现运营,开发,数据分析三个岗位简直为性价比之王,工具人的向往和35岁退休的保障。

image.png

选择城市:哪一个城市为性价比之王呢呢?

选城市一看家乡,二看未来。父母在不远游,是因为那时候没有微信不能好好的联系父母。

当可以远游后,选城市的时候就要考虑很多因素,考虑城市的发展潜力怎么样,考虑城市的环境气候怎么样,考虑未来的女朋友在哪个城市,考虑自己孩子在哪上学(不好意思想多了)等等等

其中最重要的两个要素还是这个城市招聘的岗位多不多,决定能不能找到工作;这个城市的工资水平怎么样,决定能生活水平怎么样,这里通过这两个维度进行画图分析,圈圈越大表示这个城市招聘的岗位最多,颜色表示这个城市的平均工资越高。

我们可以看到北上广深的招聘数量和工资水平都属于第一梯度;杭州,南京,苏州属于第二梯队。这些梯度内城市的选择可以随着距离家乡的距离进行考虑哦。

选择行业:哪一个行业是性价比之行呢?

行业肯定要去最赚钱的行业,那什么行业赚钱呢,一类支持国家战略,国家现在大力研发5G,如果扎进这个领域深入下去,吃足红利,但这个领域护城河很深,进入有难度;另一类去与跟最容易赚钱群体打交道的行业(小孩,女人,老人),小孩的教育和游戏,女人的美妆和衣服,老人的医疗和娱乐,基本是任何和平时代的红利,只要进入就有红利。从下图我们也可以分析出来选对行业比选对女朋友还要重要,要是去了环化材生四大专业,我由衷的敬佩你,共和国的发展就需要这种栋梁之才,我要写个for循环代码歌颂你的精神。

上图分析了各行业工资的分布状况,最明显的顶端我们可以看到教育,影视和美容,可以给大家做一个参考。当然有时候在一个自己喜欢的行业工作远超于自己对工资的期待,选择的时候着重关注每个城市的行业特色。

end:一行行行行行,一行数据


相关文章
|
23小时前
|
机器学习/深度学习 算法 数据挖掘
PYTHON银行机器学习:回归、随机森林、KNN近邻、决策树、高斯朴素贝叶斯、支持向量机SVM分析营销活动数据|数据分享-2
PYTHON银行机器学习:回归、随机森林、KNN近邻、决策树、高斯朴素贝叶斯、支持向量机SVM分析营销活动数据|数据分享
16 1
|
1天前
|
数据处理 Python
如何使用Python的Pandas库进行数据排序和排名
【4月更文挑战第22天】Pandas Python库提供数据排序和排名功能。使用`sort_values()`按列进行升序或降序排序,如`df.sort_values(by='A', ascending=False)`。`rank()`函数用于计算排名,如`df['A'].rank(ascending=False)`。多列操作可传入列名列表,如`df.sort_values(by=['A', 'B'], ascending=[True, False])`和分别对'A'、'B'列排名。
10 2
|
2天前
|
Python
如何使用Python的Pandas库进行数据缺失值处理?
Pandas在Python中提供多种处理缺失值的方法:1) 使用`isnull()`检查;2) `dropna()`删除含缺失值的行或列;3) `fillna()`用常数、前后值填充;4) `interpolate()`进行插值填充。根据需求选择合适的方法处理数据缺失。
28 9
|
4天前
|
索引 Python
如何使用Python的Pandas库进行数据透视表(pivot table)操作?
使用Pandas在Python中创建数据透视表的步骤包括:安装Pandas库,导入它,创建或读取数据(如DataFrame),使用`pd.pivot_table()`指定数据框、行索引、列索引和值,计算聚合函数(如平均分),并可打印或保存结果到文件。这允许对数据进行高效汇总和分析。
10 2
|
4天前
|
机器学习/深度学习 数据挖掘 计算机视觉
python数据分析工具SciPy
【4月更文挑战第15天】SciPy是Python的开源库,用于数学、科学和工程计算,基于NumPy扩展了优化、线性代数、积分、插值、特殊函数、信号处理、图像处理和常微分方程求解等功能。它包含优化、线性代数、积分、信号和图像处理等多个模块。通过SciPy,可以方便地执行各种科学计算任务。例如,计算高斯分布的PDF,需要结合NumPy使用。要安装SciPy,可以使用`pip install scipy`命令。这个库极大地丰富了Python在科学计算领域的应用。
9 1
|
5天前
|
JSON 关系型数据库 数据库
《Python 简易速速上手小册》第6章:Python 文件和数据持久化(2024 最新版)
《Python 简易速速上手小册》第6章:Python 文件和数据持久化(2024 最新版)
30 0
|
5天前
|
数据可视化 数据挖掘 Python
Python中数据分析工具Matplotlib
【4月更文挑战第14天】Matplotlib是Python的数据可视化库,能生成多种图表,如折线图、柱状图等。以下是一个绘制简单折线图的代码示例: ```python import matplotlib.pyplot as plt x = [1, 2, 3, 4, 5] y = [2, 4, 6, 8, 10] plt.figure() plt.plot(x, y) plt.title('简单折线图') plt.xlabel('X轴') plt.ylabel('Y轴') plt.show() ```
9 1
|
5天前
|
数据采集 SQL 数据可视化
Python数据分析工具Pandas
【4月更文挑战第14天】Pandas是Python的数据分析库,提供Series和DataFrame数据结构,用于高效处理标记数据。它支持从多种数据源加载数据,包括CSV、Excel和SQL。功能包括数据清洗(处理缺失值、异常值)、数据操作(切片、过滤、分组)、时间序列分析及与Matplotlib等库集成进行数据可视化。其高性能底层基于NumPy,适合大型数据集处理。通过加载数据、清洗、分析和可视化,Pandas简化了数据分析流程。广泛的学习资源使其成为数据分析初学者的理想选择。
10 1
|
5天前
|
机器学习/深度学习 Python 数据处理
Python中利用长短期记忆模型LSTM进行时间序列预测分析 - 预测电力负荷数据
Python中利用长短期记忆模型LSTM进行时间序列预测分析 - 预测电力负荷数据
27 0
Python中利用长短期记忆模型LSTM进行时间序列预测分析 - 预测电力负荷数据
|
5天前
|
vr&ar Python
Python 用ARIMA、GARCH模型预测分析股票市场收益率时间序列4
Python 用ARIMA、GARCH模型预测分析股票市场收益率时间序列
29 0