算法博士平均月入4万,数据可视化技能全球吃香 | 2020年《顶级数据团队建设全景报告》重磅发布

本文涉及的产品
云原生大数据计算服务 MaxCompute,5000CU*H 100GB 3个月
云原生大数据计算服务MaxCompute,500CU*H 100GB 3个月
简介: 算法博士平均月入4万,数据可视化技能全球吃香 | 2020年《顶级数据团队建设全景报告》重磅发布

2020年,对于“大数据”这个词,多数人很难再说陌生。

尤其是在疫情防控期间,从各地相继推出健康码,到全国个人行程查询,在及时发现并定位确诊患者,进一步阻止疫情扩散方面,大数据和相关从业者都做出了不可磨灭的贡献。

近年来,随着数据行业的逐渐成熟,大数据本身也开始向外辐射到医学、气象、交通等众多其他学科领域,为这些领域的从业者和科研人员提供了数据维度的知识解读。

对于大数据相关从业者而言,这既代表着一份前进的动力,同时也不可避免地引发问题和焦虑。

在此背景下,2017年起,清华大学大数据研究中心联合《大数据文摘》发布了年度研究项目《顶级数据团队建设全景报告》,致力于盘点数据团队建设现状,回答数据团队发展中面临的问题,力求为行业内数据团队的组建和高校数据人才的培养提供指导性意见。

今年,《顶级数据团队建设全景报告2020》(以下简称《报告》)如约而至。在2020年的《报告》中,我们联合战略数据合作方领英,把目光扩展到全球,希望探索全球范围内数据团队的发展规律。

年初,突如其来的疫情对全社会都造成了极大的冲击,数据团队同样受到影响。在疫情的影响下,数据从业者应该保持着怎样的心态?数据团队的建设应该逐步放缓还是迎合规律缓慢加速?

《报告》囊括十余万条网络公开招聘信息、近千份有效调查问卷内容,和全球6位优秀数据团队负责人深度访谈内容,从数据团队建设现状、全球数据团队观察和疫情对数据团队的影响几个方面,力求真实呈现现阶段数据团队的建设全景。

以下为报告部分精华内容。

一线城市、新一线城市持续吃香,算法类岗位对学历要求最高

目前,在数据团队的建设上,一线城市、新一线城市仍然保持着较大的招聘需求。

深圳、广州、上海、北京、杭州五个城市的在招职位数量最多,随后是成都、武汉、南京、长沙、苏州,整体呈现一线城市-新一线城市的梯队特征。

在学历要求上,数据行业过半都要求本科以上学历,但对硕士以上学历的要求并不明显。

算法、产品、数据、开发四类核心岗位是对学历要求比较高的岗位,本科及以上学历的要求均超过60%,其中算法岗位的学历要求中,本科及以上学历要求达到97%,硕士及以上学历要求达到35%。

网络、运营、运维三类职位的学历要求明显偏低,本科及以上学历要求均不超过50%,其中,网络类职位仅有18%要求求职者获得本科学历。

薪资待遇的差异也在各类职位中差异明显,拥有博士学位的算法岗位薪资水平最高,接近4万元。软件、开发、产品、数据等职位也在硕士或博士要求的职位中,出现了薪资的明显增长。而网络、维护等职位在本科与硕士学历岗位之间却出现了薪资倒挂现象,间接说明该类职位对于学历水平要求并不高。

数据可视化技能正在成为全球数据团队推崇技能

领英数据显示,数据分析技能和数据可视化技能是过去一年在全球数据人才中增长最快的技能,前者增长速度约为150%,后者增速同样超过100%,Microsoft Power BI在过去一年的增长速度为94%,是全球市场的新兴技能排序中首位增长速度最快的分析工具。

人工智能、数据科学与数据管理技能同样呈现较快增长速度。在过去一年中,人工智能与数据科学对数据分析的影响比较大,数据量的日益增长也促使了数据管理技能的高速发展。

在国内市场,过去一年中增长最快的技能为数据科学,增长速度为175%,相较全球范围,国内对于数据科学技能的需求更旺盛。其他技能的需求程度与国际整体较为相似。

数据从业者对职业和行业发展普遍乐观,职业规划稳定

数据团队的内部建设和氛围营造对于数据从业者来说也有着十分重要的影响,对目前的职业满意度进行调研后,我们发现,超过40%的从业者对当前的职业保持着十分积极的态度,15%左右的从业者认为目前的职业不够令人满意。

此外,《报告》也针对数据团队成员的职业规划进行了探讨。根据调研结果,在从业者的五年规划里,数据人才更愿意深挖数据方向的工作,意愿达到39%,其次有15%希望升职成为企业决策层。还有一部分数据人才更希望转型做产品经理或者尝试创业,占比均约为12%。希望维持目前工作不变的比例同样约为12%,真正考虑转行的从业者数量仅为1%。

整体而言,数据团队成员对于自己的职业规划主要集中在决策者和专家两条道路上。

中国数据团队从业者硕士学历比例超全球均值,英国博士学历从业者最多

对于数据团队或数据产业的观察,目光不应该仅局限在国内,全球前沿国家的发展现状同样至关重要。综合领英平台的数据,我们也获取了全球数据行业发展的一些趋势和动态。

随着数据行业近年来的发展,从全球范围看,招聘市场对数据人才表现出极高的需求,全球数据从业者也在稳步增长,过去一年增长率为4.4%。

从全球数据从业者的学历分布来看,数据人才普遍受教育程度高,98.5%拥有本科或以上学历,其中持本科学历的数据从业者最多,占比44%,持硕士学位者次之,占36.4%,持MBA学位者占12.1%,持博士学位者占比6%。

具体观察各个国家,领英站内印度本科及以上学历水平的从业人员占比最高,几乎所有数据行业从业人员都拥有本科或以上学历,英国拥有最多博士学历的数据从业者,占比达8.3%,美国博士学历的数据从业者占比7.4%。

与以上三国对比,中国的硕士学历从业者占比最多,达51.2%,本科次之,占比41%,但MBA与博士学历从业者较少,分别为3.6%和3.1%。

各行业数据人才涌入互联网,高等教育行业数据人才流失严重

与其他专业人才相似,数据人才同样会在不同行业之间流动。观察全球范围内数据人才最集中的十大行业,我们通过定义“行业人才吸引力指数”,发现不同行业对数据人才的吸引力指数也有所区别。

(注:行业人才吸引力指数 = 流入指定行业的人才/流出该指定行业的人才)

互联网行业毋庸置疑在全球都保持着较高的吸引力,在数据人才的流动上,信息技术与服务、金融服务、管理咨询、通信和高等教育行业中的数据人才多流入到互联网。

在计算机软件、银行、医院与护理、保险行业和互联网行业,数据人才都是从其他行业流入,而高等教育的数据人才流出现象严重,其中互联网的吸引力指数最高,达到6.27,金融服务次之,为5.20。

疫情凸显数据价值,超4成数据团队业务量不降反增

面对年初爆发的疫情,数据行业也受到了一定程度的影响和波及。

综合问卷信息,超过半数的数据从业者认为数据团队的工作受到了不同程度的影响,超过20%的受访者认为疫情对于数据团队工作的“影响较大”。

在业务量上,超过4成的受访者表示数据团队的业务量有不同程度的增加,其中3.6%的数据团队的业务量翻倍,但仍然有接近17%的数据团队表示业务量有明显减少。

不过,可以看到,尽管受到了疫情的冲击,47%数据团队从业者认为疫情对数据团队工作影响较小。

大数据文摘在此前投放的问卷调查中了解到,疫情对于企业中数据团队的业务并未造成很大的影响。在所有受访者中,17.5%表示自己所供职公司的数据团队完全没有受到影响,29.1%称几乎无影响,认为产生较大影响的比重为23.3%。

在疫情对于业务量的影响上,38.8%受访者认为数据团队业务量没有产生变化,16.9%业务量减小。44%的受访者则反映数据团队业务量增长,其中3.6%团队业务量翻倍。我们可以看到,疫情冲击下,大数据相关业务的价值正在凸显。

不难看出,一支高效运作、抗压的数据团队不仅对于所在公司至关重要,也是整个社会持续、健康发展的生力军。整体来说,疫情对于数据团队的影响并非完全负面。虽然有部分企业出现了裁员或降薪情况,但同样也出现了不少业务量增长的情况,说明数据业务价值在疫情中逐渐凸显。与此同时,疫情对于从业者的职业规划还是产生了一定影响,部分受访者原本的跳槽计划出现了变动。

相关实践学习
基于MaxCompute的热门话题分析
本实验围绕社交用户发布的文章做了详尽的分析,通过分析能得到用户群体年龄分布,性别分布,地理位置分布,以及热门话题的热度。
SaaS 模式云数据仓库必修课
本课程由阿里云开发者社区和阿里云大数据团队共同出品,是SaaS模式云原生数据仓库领导者MaxCompute核心课程。本课程由阿里云资深产品和技术专家们从概念到方法,从场景到实践,体系化的将阿里巴巴飞天大数据平台10多年的经过验证的方法与实践深入浅出的讲给开发者们。帮助大数据开发者快速了解并掌握SaaS模式的云原生的数据仓库,助力开发者学习了解先进的技术栈,并能在实际业务中敏捷的进行大数据分析,赋能企业业务。 通过本课程可以了解SaaS模式云原生数据仓库领导者MaxCompute核心功能及典型适用场景,可应用MaxCompute实现数仓搭建,快速进行大数据分析。适合大数据工程师、大数据分析师 大量数据需要处理、存储和管理,需要搭建数据仓库?学它! 没有足够人员和经验来运维大数据平台,不想自建IDC买机器,需要免运维的大数据平台?会SQL就等于会大数据?学它! 想知道大数据用得对不对,想用更少的钱得到持续演进的数仓能力?获得极致弹性的计算资源和更好的性能,以及持续保护数据安全的生产环境?学它! 想要获得灵活的分析能力,快速洞察数据规律特征?想要兼得数据湖的灵活性与数据仓库的成长性?学它! 出品人:阿里云大数据产品及研发团队专家 产品 MaxCompute 官网 https://www.aliyun.com/product/odps 
相关文章
|
15天前
|
存储 编解码 负载均衡
数据分片算法
【10月更文挑战第25天】不同的数据分片算法适用于不同的应用场景和数据特点,在实际应用中,需要根据具体的业务需求、数据分布情况、系统性能要求等因素综合考虑,选择合适的数据分片算法,以实现数据的高效存储、查询和处理。
|
15天前
|
存储 缓存 算法
分布式缓存有哪些常用的数据分片算法?
【10月更文挑战第25天】在实际应用中,需要根据具体的业务需求、数据特征以及系统的可扩展性要求等因素综合考虑,选择合适的数据分片算法,以实现分布式缓存的高效运行和数据的合理分布。
|
28天前
|
机器学习/深度学习 人工智能 算法
"拥抱AI规模化浪潮:从数据到算法,解锁未来无限可能,你准备好迎接这场技术革命了吗?"
【10月更文挑战第14天】本文探讨了AI规模化的重要性和挑战,涵盖数据、算法、算力和应用场景等方面。通过使用Python和TensorFlow的示例代码,展示了如何训练并应用一个基本的AI模型进行图像分类,强调了AI规模化在各行业的广泛应用前景。
29 5
|
20天前
|
存储 JSON 算法
TDengine 检测数据最佳压缩算法工具,助你一键找出最优压缩方案
在使用 TDengine 存储时序数据时,压缩数据以节省磁盘空间是至关重要的。TDengine 支持用户根据自身数据特性灵活指定压缩算法,从而实现更高效的存储。然而,如何选择最合适的压缩算法,才能最大限度地降低存储开销?为了解决这一问题,我们特别推出了一个实用工具,帮助用户快速判断并选择最适合其数据特征的压缩算法。
28 0
|
30天前
|
人工智能 算法 前端开发
无界批发零售定义及无界AI算法,打破传统壁垒,累积数据流量
“无界批发与零售”是一种结合了批发与零售的商业模式,通过后端逻辑、数据库设计和前端用户界面实现。该模式支持用户注册、登录、商品管理、订单处理、批发与零售功能,并根据用户行为计算信用等级,确保交易安全与高效。
|
30天前
|
前端开发 算法 JavaScript
无界SaaS模式深度解析:算力算法、链接力、数据确权制度
私域电商的无界SaaS模式涉及后端开发、前端开发、数据库设计、API接口、区块链技术、支付和身份验证系统等多个技术领域。本文通过简化框架和示例代码,指导如何将核心功能转化为技术实现,涵盖用户管理、企业店铺管理、数据流量管理等关键环节。
|
1月前
|
机器学习/深度学习 算法 数据处理
EM算法对人脸数据降维(机器学习作业06)
本文介绍了使用EM算法对人脸数据进行降维的机器学习作业。首先通过加载ORL人脸数据库,然后分别应用SVD_PCA、MLE_PCA及EM_PCA三种方法实现数据降维,并输出降维后的数据形状。此作业展示了不同PCA变种在人脸数据处理中的应用效果。
32 0
|
1月前
|
存储 算法 搜索推荐
算法进阶之路:Python 归并排序深度剖析,让数据排序变得艺术起来!
算法进阶之路:Python 归并排序深度剖析,让数据排序变得艺术起来!
70 0
|
2月前
|
存储 算法 测试技术
预见未来?Python线性回归算法:数据中的秘密预言家
【9月更文挑战第11天】在数据的海洋中,线性回归算法犹如智慧的预言家,助我们揭示未知。本案例通过收集房屋面积、距市中心距离等数据,利用Python的pandas和scikit-learn库构建房价预测模型。经过训练与测试,模型展现出较好的预测能力,均方根误差(RMSE)低,帮助房地产投资者做出更明智决策。尽管现实关系复杂多变,线性回归仍提供了有效工具,引领我们在数据世界中自信前行。
50 5