KDnuggets:未来4至10年内对数据科学家的需求将开始减少

简介:

根据近1200份投票的统计结果显示,KDnuggets的读者认为对数据科学家/机器学习专家的需求将在未来4至10年内开始减少。最常见的一种回答是4-6年,中值是8-9年。

9a2b1105619dcda6d4eb89cc14e5bd3548d4c0eb

KDnuggets问卷:对数据科学家/机器学习专家的需求何时会开始衰减?

这是一张很重要也很有意思的图表,看完之后我的想法如下……

注意:需求下降的起始点紧随着需求高峰,所以我们需要交换着使用这两个术语。

在2012年被誉为“21世纪最性感的工作”之后,市场对于数据科学家的需求开始迅速增长。这一需求的填补体现在两个方面:

教育:很多大学及其他教育平台(例如Coursera,、edX和Udemy)开始增加提供数据科学与机器语言的教育。

自动化:如同DataRobot这样的公司提供“自动化数据科学/机器学习”的平台一样,这些平台可以让商业用户自己去建模,或者在某一商业流程中嵌入模型来完全自动化数据科学(比如自动化的广告竞价)。

但目前的需求下面却潜藏着一个巨大的泡沫,这个泡沫很可能在未来的某一个时间点破裂,随后需求开始迅速下降。而且如同其它的泡沫一样,这个泡沫同样难以预测。所以需求高峰期(需求开始下降的点)出现在未来4-9年,是一个很合理的假设。但是,这并不意味着数据科学家会失业,这只是让这种工作变得常规化,使薪资水平变得平稳下来,如同互联网发展初期,网页开发者是一个炙手可热的工作,现在却成了一个稀疏平常的工作了。

问卷也调查了受访者在数据科学和机器学习方面的相关经验,以及他们所属的社会群体(产业界/学生/科研/政府/其他)。

3eb0d92a1966528613439dbf000cd05cbaac664f

问卷受访者在数据科学/机器学习方面的经历及其所属社会群体

从图中我们可以看到:60%的受访者有2年以内的相关经历,62%的被调查者来自产业界,19.5%是学生,9.2%是科研人员,4.5%来自政府及公益组织。

在检验高峰需求的预测与受访者经验、所属社会群体的关系时,我得到了惊人的相似曲线。一个高峰期是在未来4-6年和7-10年,另一个小一些的高峰出现在25年及以后。为了简单理解这个图表,我将曲线分组为“小于1年经验”,“1-2年的经验”和“2-4年的经验”,无论哪种情况,这些曲线看起来都非常相似。

对数据科学家/机器学习的高峰需求vs.受访者在数据科学/机器学习领域的相关经验

让我们把那些“预测对数据科学家的需求在25年后开始衰减”的人称为乐观主义者,而将另一部分人归类为悲观主义者吧!

我们发现,经验最多的(16年以上)这一群体占据了乐观主义者的绝大多数,而且这一群体有超过35%的人认为需求在25年之后才会逐渐减缓。

接下来,让我们看看预测高峰需求曲线与受访者所属社会群体的关系。

cd5271831f1f06a4380e548ae8a8689c9681b5c5

数据科学家/机器学习专家的高峰需求预测vs社会群体

再一次,我们出乎意料地发现:这些曲线都很相似。

其中,学生是所有群体里最乐观的,政府工作人员是最悲观的,产业界人士居于其中。

最后,我们看一下不同区域的分布。各地区参与者包括:

US/Canada, 40%
Europe, 33%
Asia, 16%
other, 11%
美国/加拿大 40%
欧洲 33%
亚洲 16%
其他 11%

2e3c2a7272b6b9dcd64ef65928cf412d4bf778a8

对数据科学家/机器学习专家的高峰需求vs地域

这一次,我们又双叒叕发现曲线依然十分相似。而一个显著的差异是:美国/加拿大的受访者相比其他区域的受访者更乐观,他们最多的选择是认为需求将在未来7-10年内饱和,而其他区域则认为是4-6年。在所有区域里面,认为25年甚至更久的受访者百分比为(18.3%-19.8%),这也是让人难以置信的相似。

如何解释这样及其相似的分布?

有一种假设是,乐观主义或者悲观主义是天生的,这会影响到他们做预测的结果。所以当我们想对“社会趋势”做预测的时候,由于这种主题的问题不能通过物理事实测量,更多的只是取决于人们的想法和直觉。所以问卷设计应该以某种方法来检测乐观主义或者悲观主义特质。

如果这个结论是真的,那么我们可以认为:乐观主义的百分比在各个不同的区域、社会群体的群组里面是相似的,而且这个相似不会随着经验发生变化。


原文发布时间为:2017-12-5

本文作者:抵抗流感的

本文来自云栖社区合作伙伴“大数据文摘”,了解相关信息可以关注“大数据文摘”微信公众号

相关文章
|
3天前
|
存储 人工智能 安全
AI 越智能,数据越危险?
阿里云提供AI全栈安全能力,为客户构建全链路数据保护体系,让企业敢用、能用、放心用
|
6天前
|
域名解析 人工智能
【实操攻略】手把手教学,免费领取.CN域名
即日起至2025年12月31日,购买万小智AI建站或云·企业官网,每单可免费领1个.CN域名首年!跟我了解领取攻略吧~
|
5天前
|
数据采集 人工智能 自然语言处理
3分钟采集134篇AI文章!深度解析如何通过云无影AgentBay实现25倍并发 + LlamaIndex智能推荐
结合阿里云无影 AgentBay 云端并发采集与 LlamaIndex 智能分析,3分钟高效抓取134篇 AI Agent 文章,实现 AI 推荐、智能问答与知识沉淀,打造从数据获取到价值提炼的完整闭环。
397 93
|
6天前
|
SQL 人工智能 自然语言处理
Geo优化SOP标准化:于磊老师的“人性化Geo”体系如何助力企业获客提效46%
随着生成式AI的普及,Geo优化(Generative Engine Optimization)已成为企业获客的新战场。然而,缺乏标准化流程(Geo优化sop)导致优化效果参差不齐。本文将深入探讨Geo专家于磊老师提出的“人性化Geo”优化体系,并展示Geo优化sop标准化如何帮助企业实现获客效率提升46%的惊人效果,为企业在AI时代构建稳定的流量护城河。
396 156
Geo优化SOP标准化:于磊老师的“人性化Geo”体系如何助力企业获客提效46%
|
5天前
|
数据采集 缓存 数据可视化
Android 无侵入式数据采集:从手动埋点到字节码插桩的演进之路
本文深入探讨Android无侵入式埋点技术,通过AOP与字节码插桩(如ASM)实现数据采集自动化,彻底解耦业务代码与埋点逻辑。涵盖页面浏览、点击事件自动追踪及注解驱动的半自动化方案,提升数据质量与研发效率,助力团队迈向高效、稳定的智能化埋点体系。(238字)
287 158
|
13天前
|
机器人 API 调度
基于 DMS Dify+Notebook+Airflow 实现 Agent 的一站式开发
本文提出“DMS Dify + Notebook + Airflow”三位一体架构,解决 Dify 在代码执行与定时调度上的局限。通过 Notebook 扩展 Python 环境,Airflow实现任务调度,构建可扩展、可运维的企业级智能 Agent 系统,提升大模型应用的工程化能力。