数据科学行业的8个关键角色:职责与技能

简介:

前言


第二届世界互联网大会的召开,将大数据战略推向了又一高潮,许多与数据相关的职位如雨后春笋般涌现,数据科学家、数据分析师、数据架构师、统计学家、数据库管理员、商业分析师和数据分析经理等。但是,许多业界人士表示分不清这些职位的区别,企业在招聘人员时,进行职位描述与岗位职责编写时略显混乱,应聘者在应聘这些职位时也不清楚这些这位的进入门槛。今天,大数据文摘将向大家推出8张数据科学相关职位信息图以及1张跟这些职位有关的薪酬信息图,带你了解数据科学行业的进入门槛与岗位职责。


引子


一天晚上,我和一位朋友喝酒,这里就叫他乔恩吧。几杯小酒过后,他开始向我吐露真言,他说他想成为一名数据科学家,并已经开始在规划他的职业生涯。


我对他的职业定位表示很好奇,便问了他一个问题:数据科学家的日常工作内容是什么?他模糊的回答让我感觉到他并没有真正了解数据科学家这个职位。于是我又跟他玩了一个小游戏:


现在有4个人A、B、C和D,每个人都有对应的职位:数据科学家,数据工程师,数据分析师,数据架构师。我把这四个人的日常工作描述给乔恩听,然后他必须根据这4个人的描述判断出他们对应的职位。


作为惩罚,他每次回答错误都得来个一口闷。你们能猜到那天晚上他喝了多少杯酒吗?如果换做你来回答,你可能需要喝多少杯酒才能回答正确呢?


下面是关于这些职位的具体介绍,一起来看看?


数据科学家 The Data Scientist


数据科学家很有可能是如今你能得到的最热门的头衔之一,并且年薪平均为11万8709美元,他们是数据科学行业收入最高的人之一。数据科学家需要会利用最新的科技手段处理原始数据,进行必要的分析,并以一种信息化的方式将获得的知识展示给他的同事。




数据分析师 The Data Analyst


如R、Python和SQL这样的编程语言是数据分析师基本知识的一部分。和数据科学家的职位有点类似,对数据分析师来说,需要掌握广泛的技能,同时具有技术和独创性的分析知识。这个职位经常为类似HP和IBM这样的公司所需要。




数据架构师 The Data Architect


数据无处不在(正在被收集着),其结果是,越来越多的企业需要数据架构师。像银行和快速消费品这样的行业需要数据架构师来整合、集中、保护和维护它们的数据源。这些数据架构师通常用最新的技术,如Spark来工作,同时经常需要处在相关业务的最高层。




统计学家 The Statistician


统计学家的头衔是经常被忽视的,或者会被听上去更时髦的头衔所代替。这是令人遗憾的,因为统计学家具有坚实的统计理论和方法基础,他们应该被看成数据科学领域的先驱。通常,他们是从数据中收获信息,然后把信息转化为可操作的见解。尽管这个头衔和今天所提到的其它头衔相比并不那么响亮,现代统计学家们却总是能够快速赶上科技前进的步伐,并将其应用于他们的研究。




数据库管理员
The Database Administrator


数据库管理员要确保组织内的每个利益相关人员能够访问数据库,实施正当和必要的安全措施保证数据存储的安全。数据库管理员需要掌握不同的技术,从SQL和XML到更普遍的编程语言,如Java。




商业分析师 The Business Analyst


这也许是今天提到的最没有技术含量的头衔了。然而,商业分析师用他们对业务流程的深刻理解弥补了技术知识的缺乏。因此,商业分析师经常在业务员和技术专家之间扮演中间人的角色。需要这样角色的公司有Uber、Dell和甲骨文。




数据和分析经理
Data and Analytics Manager


数据和分析经理负责掌握数据业务小组的工作方向。这个职位需要将SQL、R、SAS等等各种强大技能的各种组合与处理团体工作所需的天生社交能力进行完美整合。这是个难度很大的职位,如果你准备好了挑战,一定要看看来自Coursera、Slack这样公司的招聘信息。幸运的是,这个职位的平均年薪有11万6千美元,对于这么高的职位要求来说,这个经济补偿还是符合实际情况的。




Data Engineer




最后来看看收入吧!




角色 年薪($)
数据分析师 62,379
商业分析师 65,991
数据库管理员 67,672
统计科学家 75,069
数据工程师 95,936
数据架构师 100,118
数据和分析经理 116,725
数据科学家 118,709


这下该清楚了!你想做哪个呢?

原文发布时间为:2015-12-21

本文来自云栖社区合作伙伴“大数据文摘”,了解相关信息可以关注“BigDataDigest”微信公众号

相关文章
|
程序员 编译器 Linux
V 语言
V 是一门通用的编程语言,也可以作为系统语言,其网站说它非常简单,你可以在一个周末学会,它还说 Go 程序员会对该语言非常熟悉,因为 V 语言在很多方面借鉴了 Go。
501 2
|
机器学习/深度学习 自然语言处理 程序员
NLP:Transformer的简介(优缺点)、架构详解、案例应用之详细攻略
NLP:Transformer的简介(优缺点)、架构详解、案例应用之详细攻略
NLP:Transformer的简介(优缺点)、架构详解、案例应用之详细攻略
Vue2——监听页面滚动实现菜单和页面对应
Vue2——监听页面滚动实现菜单和页面对应
144 1
|
固态存储 Linux Shell
阿里云Linux服务器性能测试wget -qO- bench.sh | bash
阿里云服务器性能测试,使用知名博主的wget -qO- bench.sh | bash来测试下阿里云服务器CPU Model(CPU型号)、CPU Cores(核数)、CPU Frequency(主频)、Total Disk(磁盘容量)、Total Mem(内存)、Swap(虚拟内存)、系统发行版本、Linux内核、地域节点、磁盘I/O读写速度及云服务器上传下载速度测试
1155 0
阿里云Linux服务器性能测试wget -qO- bench.sh | bash
|
搜索推荐 前端开发 数据可视化
基于Python协同过滤的旅游景点推荐系统,采用Django框架,MySQL数据存储,Bootstrap前端,echarts可视化实现
本文介绍了一个基于Python协同过滤算法的旅游景点推荐系统,该系统采用Django框架、MySQL数据库、Bootstrap前端和echarts数据可视化技术,旨在为用户提供个性化的旅游推荐服务,提升用户体验和旅游市场增长。
1472 9
基于Python协同过滤的旅游景点推荐系统,采用Django框架,MySQL数据存储,Bootstrap前端,echarts可视化实现
|
机器学习/深度学习 搜索推荐 数据挖掘
【深度解析】超越RMSE和MSE:揭秘更多机器学习模型性能指标,助你成为数据分析高手!
【8月更文挑战第17天】本文探讨机器学习模型评估中的关键性能指标。从均方误差(MSE)和均方根误差(RMSE)入手,这两种指标对较大预测偏差敏感,适用于回归任务。通过示例代码展示如何计算这些指标及其它如平均绝对误差(MAE)和决定系数(R²)。此外,文章还介绍了分类任务中的准确率、精确率、召回率和F1分数,并通过实例说明这些指标的计算方法。最后,强调根据应用场景选择合适的性能指标的重要性。
1329 0
|
网络协议 算法 网络性能优化
TCP 重传、滑动窗口、流量控制、拥塞控制
TCP 重传、滑动窗口、流量控制、拥塞控制
|
JavaScript 前端开发 算法
文件拖拽上传功能已经烂大街了,你还不会吗?
文件拖拽上传功能已经烂大街了,你还不会吗?
327 0
|
存储 传感器 边缘计算
物联网体系架构解析:感知、通信与智能的融合
本篇深入剖析了物联网体系架构的关键要素,围绕感知、通信与应用层,以及边缘计算和云计算的角色进行了详细探讨。在感知层,各种传感器、执行器和物理设备的作用被阐述,它们负责采集环境数据和执行操作。传输层则负责数据传输和通信,确保感知层数据能够流畅传送。而应用层是物联网的最终目标,集成了各类应用和服务,通过分析传输层数据来实现智能化决策和控制。
1203 0
|
NoSQL Go MongoDB
golang下的UUID生成
包括标准的UUID,snowflake,MongoDB ObjectID等等。。
1714 0