算法博士平均月入4万,数据可视化技能全球吃香 | 2020年《顶级数据团队建设全景报告》重磅发布

简介: 算法博士平均月入4万,数据可视化技能全球吃香 | 2020年《顶级数据团队建设全景报告》重磅发布

2020年,对于“大数据”这个词,多数人很难再说陌生。

尤其是在疫情防控期间,从各地相继推出健康码,到全国个人行程查询,在及时发现并定位确诊患者,进一步阻止疫情扩散方面,大数据和相关从业者都做出了不可磨灭的贡献。

近年来,随着数据行业的逐渐成熟,大数据本身也开始向外辐射到医学、气象、交通等众多其他学科领域,为这些领域的从业者和科研人员提供了数据维度的知识解读。

对于大数据相关从业者而言,这既代表着一份前进的动力,同时也不可避免地引发问题和焦虑。

在此背景下,2017年起,清华大学大数据研究中心联合《大数据文摘》发布了年度研究项目《顶级数据团队建设全景报告》,致力于盘点数据团队建设现状,回答数据团队发展中面临的问题,力求为行业内数据团队的组建和高校数据人才的培养提供指导性意见。

今年,《顶级数据团队建设全景报告2020》(以下简称《报告》)如约而至。在2020年的《报告》中,我们联合战略数据合作方领英,把目光扩展到全球,希望探索全球范围内数据团队的发展规律。

年初,突如其来的疫情对全社会都造成了极大的冲击,数据团队同样受到影响。在疫情的影响下,数据从业者应该保持着怎样的心态?数据团队的建设应该逐步放缓还是迎合规律缓慢加速?

《报告》囊括十余万条网络公开招聘信息、近千份有效调查问卷内容,和全球6位优秀数据团队负责人深度访谈内容,从数据团队建设现状、全球数据团队观察和疫情对数据团队的影响几个方面,力求真实呈现现阶段数据团队的建设全景。

以下为报告部分精华内容。

一线城市、新一线城市持续吃香,算法类岗位对学历要求最高

目前,在数据团队的建设上,一线城市、新一线城市仍然保持着较大的招聘需求。

深圳、广州、上海、北京、杭州五个城市的在招职位数量最多,随后是成都、武汉、南京、长沙、苏州,整体呈现一线城市-新一线城市的梯队特征。

在学历要求上,数据行业过半都要求本科以上学历,但对硕士以上学历的要求并不明显。

算法、产品、数据、开发四类核心岗位是对学历要求比较高的岗位,本科及以上学历的要求均超过60%,其中算法岗位的学历要求中,本科及以上学历要求达到97%,硕士及以上学历要求达到35%。

网络、运营、运维三类职位的学历要求明显偏低,本科及以上学历要求均不超过50%,其中,网络类职位仅有18%要求求职者获得本科学历。

薪资待遇的差异也在各类职位中差异明显,拥有博士学位的算法岗位薪资水平最高,接近4万元。软件、开发、产品、数据等职位也在硕士或博士要求的职位中,出现了薪资的明显增长。而网络、维护等职位在本科与硕士学历岗位之间却出现了薪资倒挂现象,间接说明该类职位对于学历水平要求并不高。

数据可视化技能正在成为全球数据团队推崇技能

领英数据显示,数据分析技能和数据可视化技能是过去一年在全球数据人才中增长最快的技能,前者增长速度约为150%,后者增速同样超过100%,Microsoft Power BI在过去一年的增长速度为94%,是全球市场的新兴技能排序中首位增长速度最快的分析工具。

人工智能、数据科学与数据管理技能同样呈现较快增长速度。在过去一年中,人工智能与数据科学对数据分析的影响比较大,数据量的日益增长也促使了数据管理技能的高速发展。

在国内市场,过去一年中增长最快的技能为数据科学,增长速度为175%,相较全球范围,国内对于数据科学技能的需求更旺盛。其他技能的需求程度与国际整体较为相似。

数据从业者对职业和行业发展普遍乐观,职业规划稳定

数据团队的内部建设和氛围营造对于数据从业者来说也有着十分重要的影响,对目前的职业满意度进行调研后,我们发现,超过40%的从业者对当前的职业保持着十分积极的态度,15%左右的从业者认为目前的职业不够令人满意。

此外,《报告》也针对数据团队成员的职业规划进行了探讨。根据调研结果,在从业者的五年规划里,数据人才更愿意深挖数据方向的工作,意愿达到39%,其次有15%希望升职成为企业决策层。还有一部分数据人才更希望转型做产品经理或者尝试创业,占比均约为12%。希望维持目前工作不变的比例同样约为12%,真正考虑转行的从业者数量仅为1%。

整体而言,数据团队成员对于自己的职业规划主要集中在决策者和专家两条道路上。

中国数据团队从业者硕士学历比例超全球均值,英国博士学历从业者最多

对于数据团队或数据产业的观察,目光不应该仅局限在国内,全球前沿国家的发展现状同样至关重要。综合领英平台的数据,我们也获取了全球数据行业发展的一些趋势和动态。

随着数据行业近年来的发展,从全球范围看,招聘市场对数据人才表现出极高的需求,全球数据从业者也在稳步增长,过去一年增长率为4.4%。

从全球数据从业者的学历分布来看,数据人才普遍受教育程度高,98.5%拥有本科或以上学历,其中持本科学历的数据从业者最多,占比44%,持硕士学位者次之,占36.4%,持MBA学位者占12.1%,持博士学位者占比6%。

具体观察各个国家,领英站内印度本科及以上学历水平的从业人员占比最高,几乎所有数据行业从业人员都拥有本科或以上学历,英国拥有最多博士学历的数据从业者,占比达8.3%,美国博士学历的数据从业者占比7.4%。

与以上三国对比,中国的硕士学历从业者占比最多,达51.2%,本科次之,占比41%,但MBA与博士学历从业者较少,分别为3.6%和3.1%。

各行业数据人才涌入互联网,高等教育行业数据人才流失严重

与其他专业人才相似,数据人才同样会在不同行业之间流动。观察全球范围内数据人才最集中的十大行业,我们通过定义“行业人才吸引力指数”,发现不同行业对数据人才的吸引力指数也有所区别。

(注:行业人才吸引力指数 = 流入指定行业的人才/流出该指定行业的人才)

互联网行业毋庸置疑在全球都保持着较高的吸引力,在数据人才的流动上,信息技术与服务、金融服务、管理咨询、通信和高等教育行业中的数据人才多流入到互联网。

在计算机软件、银行、医院与护理、保险行业和互联网行业,数据人才都是从其他行业流入,而高等教育的数据人才流出现象严重,其中互联网的吸引力指数最高,达到6.27,金融服务次之,为5.20。

疫情凸显数据价值,超4成数据团队业务量不降反增

面对年初爆发的疫情,数据行业也受到了一定程度的影响和波及。

综合问卷信息,超过半数的数据从业者认为数据团队的工作受到了不同程度的影响,超过20%的受访者认为疫情对于数据团队工作的“影响较大”。

在业务量上,超过4成的受访者表示数据团队的业务量有不同程度的增加,其中3.6%的数据团队的业务量翻倍,但仍然有接近17%的数据团队表示业务量有明显减少。

不过,可以看到,尽管受到了疫情的冲击,47%数据团队从业者认为疫情对数据团队工作影响较小。

大数据文摘在此前投放的问卷调查中了解到,疫情对于企业中数据团队的业务并未造成很大的影响。在所有受访者中,17.5%表示自己所供职公司的数据团队完全没有受到影响,29.1%称几乎无影响,认为产生较大影响的比重为23.3%。

在疫情对于业务量的影响上,38.8%受访者认为数据团队业务量没有产生变化,16.9%业务量减小。44%的受访者则反映数据团队业务量增长,其中3.6%团队业务量翻倍。我们可以看到,疫情冲击下,大数据相关业务的价值正在凸显。

不难看出,一支高效运作、抗压的数据团队不仅对于所在公司至关重要,也是整个社会持续、健康发展的生力军。整体来说,疫情对于数据团队的影响并非完全负面。虽然有部分企业出现了裁员或降薪情况,但同样也出现了不少业务量增长的情况,说明数据业务价值在疫情中逐渐凸显。与此同时,疫情对于从业者的职业规划还是产生了一定影响,部分受访者原本的跳槽计划出现了变动。

相关实践学习
简单用户画像分析
本场景主要介绍基于海量日志数据进行简单用户画像分析为背景,如何通过使用DataWorks完成数据采集 、加工数据、配置数据质量监控和数据可视化展现等任务。
SaaS 模式云数据仓库必修课
本课程由阿里云开发者社区和阿里云大数据团队共同出品,是SaaS模式云原生数据仓库领导者MaxCompute核心课程。本课程由阿里云资深产品和技术专家们从概念到方法,从场景到实践,体系化的将阿里巴巴飞天大数据平台10多年的经过验证的方法与实践深入浅出的讲给开发者们。帮助大数据开发者快速了解并掌握SaaS模式的云原生的数据仓库,助力开发者学习了解先进的技术栈,并能在实际业务中敏捷的进行大数据分析,赋能企业业务。 通过本课程可以了解SaaS模式云原生数据仓库领导者MaxCompute核心功能及典型适用场景,可应用MaxCompute实现数仓搭建,快速进行大数据分析。适合大数据工程师、大数据分析师 大量数据需要处理、存储和管理,需要搭建数据仓库?学它! 没有足够人员和经验来运维大数据平台,不想自建IDC买机器,需要免运维的大数据平台?会SQL就等于会大数据?学它! 想知道大数据用得对不对,想用更少的钱得到持续演进的数仓能力?获得极致弹性的计算资源和更好的性能,以及持续保护数据安全的生产环境?学它! 想要获得灵活的分析能力,快速洞察数据规律特征?想要兼得数据湖的灵活性与数据仓库的成长性?学它! 出品人:阿里云大数据产品及研发团队专家 产品 MaxCompute 官网 https://www.aliyun.com/product/odps 
相关文章
C4.
|
1月前
|
算法 程序员 C语言
C语言的选择结构与数据算法
C语言的选择结构与数据算法
C4.
17 0
|
1月前
|
算法
【MATLAB】语音信号识别与处理:滑动平均滤波算法去噪及谱相减算法呈现频谱
【MATLAB】语音信号识别与处理:滑动平均滤波算法去噪及谱相减算法呈现频谱
42 0
|
2月前
|
机器学习/深度学习 数据采集 搜索推荐
Paper Digest | 突破个性化推荐数据稀疏性:长尾增强的图对比学习算法研究
本文提出了一种新的长尾增强的图对比学习方法(LAGCL),该方法促使模型同时兼顾头部节点与尾部节点之间的知识,并通过长尾增强技术来使模型产出更均匀更准确的节点表征,从而改进基于 GNN 的推荐任务。
|
3月前
|
存储 算法 Python
Python 集合探索:解密高效数据操作和快速算法的奇妙世界
Python 集合探索:解密高效数据操作和快速算法的奇妙世界
|
2月前
|
编解码 算法 定位技术
GEE时序——利用sentinel-2(哨兵-2)数据进行地表物候学分析(时间序列平滑法估算和非平滑算法代码)
GEE时序——利用sentinel-2(哨兵-2)数据进行地表物候学分析(时间序列平滑法估算和非平滑算法代码)
71 3
|
1月前
|
算法
【MATLAB】语音信号识别与处理:卷积滑动平均滤波算法去噪及谱相减算法呈现频谱
【MATLAB】语音信号识别与处理:卷积滑动平均滤波算法去噪及谱相减算法呈现频谱
27 0
|
1月前
|
算法
【MATLAB】语音信号识别与处理:高斯加权移动平均滤波算法去噪及谱相减算法呈现频谱
【MATLAB】语音信号识别与处理:高斯加权移动平均滤波算法去噪及谱相减算法呈现频谱
93 0
|
2天前
|
算法 数据可视化 Python
Python中LARS和Lasso回归之最小角算法Lars分析波士顿住房数据实例
Python中LARS和Lasso回归之最小角算法Lars分析波士顿住房数据实例
11 0
|
3天前
电信公司churn数据客户流失k近邻(knn)模型预测分析
电信公司churn数据客户流失k近邻(knn)模型预测分析
15 0
|
4月前
|
机器学习/深度学习 分布式计算 并行计算
【MATLAB】史上最全的13种数据拟合算法全家桶
【MATLAB】史上最全的13种数据拟合算法全家桶
212 1