数据科学家是不是特有前途的职业?

简介: 人工智能和大数据热起来。无数培训班开始靠讲Python、机器学习等课大赚其钱,大学里的那些稍沾点边的商科专业都开始设立建模预测的课程。在企业里收到的简历也是越来越多地号称耍过神经网络、深度学习,经历过N多建模预测的项目。未来的职场,看起来会有满世界的数据科学家。

人工智能和大数据热起来。无数培训班开始靠讲Python、机器学习等课大赚其钱,大学里的那些稍沾点边的商科专业都开始设立建模预测的课程。在企业里收到的简历也是越来越多地号称耍过神经网络、深度学习,经历过N多建模预测的项目。未来的职场,看起来会有满世界的数据科学家。

从需求端角度上看确实有这种趋势。数据慢慢积累上来了,人工智能概念也在迅速普及,人们都开始有了这种意识,都想利用积累的数据做些分析预测之类的事情,这类业务就逐步变得很多,自然对从业人员的需求就变多了,而现在总体来讲数据科学家又少又贵还是个常态,有点AI技能的找个工作都不难,老板还天天担心你跑掉。


但是,数据科学家作为一种职业,长远一点看却未必很有前途。

为啥?

因为还有一个领域也开始被人工智能带得热门起来了,就是自动机器学习软件

比如这个,国内知名数据软件公司润乾出品的易明建模YModel,地道国货,还完全免费,去润乾官网就可以下载。来感受一下:

在这里插入图片描述

只要把数据准备好丢进去,几分钟就能建好模型用于预测了,过程中基本不需要懂数据挖掘的人介入,也就是最后看效果时需要了解一些模型评价的指标就可以。麻烦的事都是数据准备,这是自动化软件不会做的事,但也和数据科学家擅长的事不搭界。

这只是其中比较轻量级的一款,还有更多能自动做机器学习的软件,包括google等大牌厂商都在加入这个阵营。


如果你没有认真学习这些建模算法的原理,只是在培训班和速成课里学过些概念和操作,那你还不见得做得过这玩意儿。

在实践这个易明建模软件的过程中发生过N回这种情况,程序写得很溜的IT专业同学,使用Python开源包建出来的预测模型,准确率就是赶不上它。其实易明建模也是用Python开源包做的,大家用的是同一套基础东西。但是,只懂IT的同学常常没有认真系统地学过这些模型算法的原理,不知道数据该怎么做预处理、什么情况该做纠偏了、补缺失值时该用啥规则;也不知道这几十种算法哪种各有啥特点、适合啥场景、又该填什么样的参数。要认真系统地学习人工智能算法原理,大体相当于读半个统计专业的博士,几个月的速成培训班是搞不定的。

而易明建模中却固化了统计专家数十年的经验,这样只擅长IT技能的数据挖掘入门级选手当然就做不过了。而且,不仅准确率更好,工作效率也差很多啊,这玩意儿跑个三分钟就能出模型,人工来做怎么也得搞上几天吧;更关键的是,这个软件还不要钱,还能没日没夜地干活,而一个数据科学家的工资得多少?你说未来的老板们面对这种情况会怎么想?

结果,粗略学过机器学习知识的普通型数据科学家,还不如那些有行业经验的从业人员更管用。丰富的业务经验还能把数据准备得更好,从而也能让模型做得更精准。自动化建模软件也只能解决人工智能的技术问题,没办法自动发现业务知识,所以即使有自动化软件也需要好的业务知识配合才能建出好模型。

未来的职场,大概率不会是满世界的数据科学家,而是满世界的自动人工智能软件加行业业务专家。

打个比方,就像现在医院里做化验。以前,需要相当技能的人员才搞得了,也只有高级医院才配得起,这些人也很吃香;后来呢,后来自动化仪器来了,是个人都会做了,是个医院也都能做了。


这么一说,是不是感到危机重重?数据科学家这职业是不是彻底凉凉了?

那当然也不是。

像易明建模这样的自动化AI软件也是要人去做的,这更需要优秀的数据科学家才做得出来了。而且,软件也没那么智能,总有搞不定的情况,这时候仍然需要精通算法原理的数据科学家才能搞定。不过,精通算法原理是前提,否则,软件搞不定的事你也搞不定。

只是,成为这种人的难度当然很大,而且这种人的需求量也不会很大,大部分常规的数据科学事务都会被自动化的软件替代掉。


数据科学家这个职业很有前途,但仅限于下过苦功N年寒窗的顶尖高手。街上培训班或者大学里速成班里涮一下出来的,那还是省省吧。

相关文章
|
数据采集 机器学习/深度学习 算法
探索数据科学家的日常:揭秘职业背后的故事
探索数据科学家的日常:揭秘职业背后的故事
259 10
|
网络协议 Python
IP地址探秘:识别与解析的Python之旅 🚀
《IP地址探秘:识别与解析的Python之旅》通过Python的`ipaddress`模块,轻松实现IP地址的分类(如单播、多播、私有、环回或公有)及子网内所有IP的生成,使网络管理更加便捷高效。示例代码直观展示了功能实现过程。
295 1
|
10月前
|
传感器 人工智能 算法
大数据进了体育圈,运动员还靠天赋吃饭吗?
大数据进了体育圈,运动员还靠天赋吃饭吗?
198 0
|
并行计算 C++ 异构计算
【环境配置】安装windows版本的TensorRt
【环境配置】安装windows版本的TensorRt
2118 4
|
机器学习/深度学习 设计模式 自然语言处理
【算法分析与设计】算法概述
【算法分析与设计】算法概述
|
XML JSON 监控
淘宝商品数据接口实战:自动化监控与竞品分析
淘宝开放平台提供的商品列表数据接口是一种API,使开发者能编程获取淘宝商品数据。主要功能包括按关键词、分类等获取商品列表及其详情,并支持分页、排序及多维度筛选。常见参数有关键词、页码、排序方式等。使用需注册账号获取API密钥,构建并发送HTTP请求,解析JSON/XML响应数据进行业务处理。此接口适用于商品监控、市场分析等多种场景。[体验API](http://u6v.cn/5W41Dx)
|
存储 Dragonfly 调度
Dragonfly是什么
Dragonfly是什么
1421 4
|
JavaScript 数据库
codemirror+js-yaml实现YAML格式的文本编辑器以及校验YAML格式是否符合规范的实现
codemirror+js-yaml实现YAML格式的文本编辑器以及校验YAML格式是否符合规范的实现
4599 0
|
存储 网络协议 Java
【JavaEE】网络编程示例1-UDP套接字数据报编程 == 一发一收
JavaEE & 网络编程示例1 & UDP套接字数据报编程 ==> 一发一收
389 0