数据科学家是不是特有前途的职业?

简介: 人工智能和大数据热起来。无数培训班开始靠讲Python、机器学习等课大赚其钱,大学里的那些稍沾点边的商科专业都开始设立建模预测的课程。在企业里收到的简历也是越来越多地号称耍过神经网络、深度学习,经历过N多建模预测的项目。未来的职场,看起来会有满世界的数据科学家。

人工智能和大数据热起来。无数培训班开始靠讲Python、机器学习等课大赚其钱,大学里的那些稍沾点边的商科专业都开始设立建模预测的课程。在企业里收到的简历也是越来越多地号称耍过神经网络、深度学习,经历过N多建模预测的项目。未来的职场,看起来会有满世界的数据科学家。

从需求端角度上看确实有这种趋势。数据慢慢积累上来了,人工智能概念也在迅速普及,人们都开始有了这种意识,都想利用积累的数据做些分析预测之类的事情,这类业务就逐步变得很多,自然对从业人员的需求就变多了,而现在总体来讲数据科学家又少又贵还是个常态,有点AI技能的找个工作都不难,老板还天天担心你跑掉。


但是,数据科学家作为一种职业,长远一点看却未必很有前途。

为啥?

因为还有一个领域也开始被人工智能带得热门起来了,就是自动机器学习软件

比如这个,国内知名数据软件公司润乾出品的易明建模YModel,地道国货,还完全免费,去润乾官网就可以下载。来感受一下:

在这里插入图片描述

只要把数据准备好丢进去,几分钟就能建好模型用于预测了,过程中基本不需要懂数据挖掘的人介入,也就是最后看效果时需要了解一些模型评价的指标就可以。麻烦的事都是数据准备,这是自动化软件不会做的事,但也和数据科学家擅长的事不搭界。

这只是其中比较轻量级的一款,还有更多能自动做机器学习的软件,包括google等大牌厂商都在加入这个阵营。


如果你没有认真学习这些建模算法的原理,只是在培训班和速成课里学过些概念和操作,那你还不见得做得过这玩意儿。

在实践这个易明建模软件的过程中发生过N回这种情况,程序写得很溜的IT专业同学,使用Python开源包建出来的预测模型,准确率就是赶不上它。其实易明建模也是用Python开源包做的,大家用的是同一套基础东西。但是,只懂IT的同学常常没有认真系统地学过这些模型算法的原理,不知道数据该怎么做预处理、什么情况该做纠偏了、补缺失值时该用啥规则;也不知道这几十种算法哪种各有啥特点、适合啥场景、又该填什么样的参数。要认真系统地学习人工智能算法原理,大体相当于读半个统计专业的博士,几个月的速成培训班是搞不定的。

而易明建模中却固化了统计专家数十年的经验,这样只擅长IT技能的数据挖掘入门级选手当然就做不过了。而且,不仅准确率更好,工作效率也差很多啊,这玩意儿跑个三分钟就能出模型,人工来做怎么也得搞上几天吧;更关键的是,这个软件还不要钱,还能没日没夜地干活,而一个数据科学家的工资得多少?你说未来的老板们面对这种情况会怎么想?

结果,粗略学过机器学习知识的普通型数据科学家,还不如那些有行业经验的从业人员更管用。丰富的业务经验还能把数据准备得更好,从而也能让模型做得更精准。自动化建模软件也只能解决人工智能的技术问题,没办法自动发现业务知识,所以即使有自动化软件也需要好的业务知识配合才能建出好模型。

未来的职场,大概率不会是满世界的数据科学家,而是满世界的自动人工智能软件加行业业务专家。

打个比方,就像现在医院里做化验。以前,需要相当技能的人员才搞得了,也只有高级医院才配得起,这些人也很吃香;后来呢,后来自动化仪器来了,是个人都会做了,是个医院也都能做了。


这么一说,是不是感到危机重重?数据科学家这职业是不是彻底凉凉了?

那当然也不是。

像易明建模这样的自动化AI软件也是要人去做的,这更需要优秀的数据科学家才做得出来了。而且,软件也没那么智能,总有搞不定的情况,这时候仍然需要精通算法原理的数据科学家才能搞定。不过,精通算法原理是前提,否则,软件搞不定的事你也搞不定。

只是,成为这种人的难度当然很大,而且这种人的需求量也不会很大,大部分常规的数据科学事务都会被自动化的软件替代掉。


数据科学家这个职业很有前途,但仅限于下过苦功N年寒窗的顶尖高手。街上培训班或者大学里速成班里涮一下出来的,那还是省省吧。

相关文章
|
机器学习/深度学习 人工智能 搜索推荐
Codewave学习体验分享:低代码开发世界的黑马
Codewave学习体验分享:低代码开发世界的黑马
|
消息中间件 缓存 Java
根据实际开发经验(订单管理系统),谈谈多线程开发的好处
根据实际开发经验(订单管理系统),谈谈多线程开发的好处
248 0
|
机器学习/深度学习 并行计算 数据挖掘
请详细介绍GPU加速
【10月更文挑战第20天】请详细介绍GPU加速
|
9月前
|
数据采集 机器学习/深度学习 算法
探索数据科学家的日常:揭秘职业背后的故事
探索数据科学家的日常:揭秘职业背后的故事
160 10
|
人工智能 数据管理 API
手把手教你搭建企业微信AI助手
全程图文,一步一步带你搭建基于云百炼的RAG应用,并配置知识库,让AI助手更专业、更智能。
2479 1
|
并行计算 C++ 异构计算
【环境配置】安装windows版本的TensorRt
【环境配置】安装windows版本的TensorRt
1546 4
|
9月前
|
供应链 数据挖掘 API
1688APP 原数据 API 接口的开发、应用与收益
1688作为阿里巴巴旗下的B2B平台,汇聚海量供应商和商品资源。其APP原数据API接口为开发者提供获取商品详细信息的强大工具,涵盖商品标题、价格、图片等。通过注册开放平台账号、申请API权限并调用接口,开发者可构建比价工具、供应链管理及自动化上架工具等应用,提升用户体验与运营效率,创造新的商业模式。示例代码展示了如何使用Python调用API并解析返回结果。
643 8
|
11月前
|
存储 NoSQL 编译器
【C语言】指针的神秘探险:从入门到精通的奇幻之旅 !
指针是一个变量,它存储另一个变量的内存地址。换句话说,指针“指向”存储在内存中的某个数据。
370 7
【C语言】指针的神秘探险:从入门到精通的奇幻之旅 !
|
机器学习/深度学习 设计模式 自然语言处理
【算法分析与设计】算法概述
【算法分析与设计】算法概述
|
监控 网络协议 Shell
ip和ip网段攻击拦截系统-绿叶结界防火墙系统shell脚本
这是一个名为“小绿叶技术博客扫段攻击拦截系统”的Bash脚本,用于监控和拦截TCP攻击。通过抓取网络数据包监控可疑IP,并利用iptables和firewalld防火墙规则对这些IP进行拦截。同时,该系统能够查询数据库中的白名单,确保合法IP不受影响。此外,它还具备日志记录功能,以便于后续分析和审计。
250 6