想入门数据分析,现在转行还来得及吗?

简介:

2014年,“大数据” 成为国内年度热词,并首次出现在当年的《政府工作报告中》。同年,数据分析也同样成为朝阳行业,数据分析一度霸屏各招聘网站。

许多计算机、统计学和数学出身的毕业生纷纷开始投入数据分析行业,同样的也有转行的大队伍。对于那些在本岗位工作了很久的在职者可能会有这样一个顾虑:

数据分析师岗位对年龄有限制吗?我这个年纪再转行还来得及吗?

我们先说有没有,再讨论是不是,笔者查询了两个典型的招聘网站对数据分析师岗位的要求。

第一个网站是某聘,我们看到搜索框的条件里有公司分类、行业的类别、城市选项和薪资,更多的类别也就是发布的时间、职位类型、企业规模和性质。

416bf91293e248f92cd493c334658053ed905d42

第二人才招聘网站是某忧,搜索框的条件是这样的:

d11e21f12918fe28b7ba631a85edeb597c74bd91

某忧的筛选框是相对完整的,多了工作年限(也就是工作经验,注意不是年纪)和学历的选项,而具体的每个岗位招聘页面信息不会超出这个筛选范围的,要是出现年纪要求才是奇怪了,那可是就业歧视(年纪在允许就业范围内)。事实上除了一些特殊行业,如在核岛、常规岛工作的招聘,出于核辐射等考虑不会招女性(影响生育),大部分工作都对不影响工作的属性如年纪、性别、身高等不做限制,如果有一家企业说招聘数据分析师要求对方24岁男身高180,可以立即举报,这种企业会为这种荒诞的职业要求作出代价。

事实上,我们所要讨论的有价值的方向是:在数据分析师岗位,我这个年纪再转行可行吗?

步入中年,又不是相关专业出身,家庭生活等压力比年轻人重,能不能转行投入到数据分析师岗位呢?

没有人能够替别人做出满意的选择,这个问题无法回答能不能,但笔者可以提供一些信息帮助正在做选择的你一起启发和思考。

首先,让我们看到进入数据分析需要哪些能力。

数据分析入门标准

SQL

数据库。数据分析师做数据分析,数据是基本,数据可能是第三方提供的数据,也可能是自己爬虫爬取的。但企业里更多的情况是,数据是存储在数据库里的,如何在数据库里选取自己想要的、有约定条件的数据,怎么建立多表之间的联系就是SQL这部分需要掌握的技能,SQL也是数据分析最基础的技能。

统计学

统计学可以分为描述性统计和推断统计。推断统计是统计学里的核心内容,统计学家一直在做的事情就是怎么根据样本来评测总体;方差分析、回归、聚类分析、主成份分析、时间序列分析等都是以后做数据分析可能有到的理论知识。这里推荐中国人民出版社贾俊平的《统计学》,是非常经典的统计学习教材。

统计分析工具

统计分析软件很多,这里简单介绍主流的3种。

SPSS

作为一款菜单式操作软件要比编程性软件入门简单,主要优点就是好上手。事实上,统计学专业常常在学习统计学原理之后学习SPSS的操作学习,对理论知识进行一个实践。如今,SPSS在企业中常做数据量相对小的、数据质量较好的数据分析,如调查问卷后的数据进行分析。就业需求面的话现在来说相对没有那么广,不过对统计学理论的理解是有帮助的,推荐高等教育出版社张文彤的《SPSS统计分析基础教程(第2版)》

R

R 语言与起源于贝尔实验室的S语言相似,R也是一款开源的为统计计算和数据可视化而生的软件,R的功能非常丰富,所以R的学习曲线也较为陡峭。经典的R学习书如人民邮电出版社的《R语言实战(第2版)》

Python

跟R一样,Python也是一种动态编程语言,R跟Python的受欢迎程度时常变动,近年来,由于Python有不断改良的库(主要pandas),和大数据、人工智能等兴起,企业越偏好用Python,Python由于其解释性和功能的强大,因此市面上关于Python的书籍特别多,光是利用Python做数据分析这个方向就已经很多了,大家看的多的话推荐Wes McKinney的《利用Python进行数据分析》

学习过程中的担忧

恐惧代码

即便是计算机相关专业的学生,也未必做到全然投入喜欢到写代码的状态,何况是其他专业或者换行的人群呢。其实,数据分析虽然要写代码,但重点不是写代码,而是统计学和业务的理解,数据分析代码以脚本语言为主。如Python,很多算法、函数已经封装好,不需要自己编写,直接调用。所以这里的编程工作并不是大家脑海里那种程序员。数据分析师更注意的是对数据怎么进行预处理、使用什么模型、参数调优等。

人工智能

未来是AI的时代,为什么不直接投入到大数据、机器学习等领域呢?暂且不说这个领域比数据分析所需要的知识,能力要求高多少倍,仅仅是入门所需要的学习内容就已经吓到很多人了。事实上,做数据分析会是未来转入AI行业一个很好的跳板,数据分析算是如今学习成本和薪水报酬相对比较为友好的一种技术行业了。熟悉行业知识,又掌握数据分析、挖掘的能力,这些专业知识会成为你转入未来人工智能时代的拥有跨界能力的巨大财富。

结语

最后,希望这篇文章对正在考虑要不要转行数据分析焦虑的你做一点信息上的帮助,帮助你弄清楚数据分析要做什么,要具备哪些技能,去理性的选择,而不是因为这个行业陡峭的学习曲线而轻易放弃,也不是因为这个行业的火热而不思考轻易去跟风。


原文发布时间为:2018-10-16

本文来自云栖社区合作伙伴“CDA数据分析师”,了解相关信息可以关注“CDA数据分析师”。

相关文章
|
5月前
|
机器学习/深度学习 数据采集 数据可视化
Python数据分析入门:基础知识与必备工具
【4月更文挑战第12天】Python是大数据时代数据分析的热门语言,以其简单易学和丰富库资源备受青睐。本文介绍了Python数据分析基础,包括Python语言特点、数据分析概念及其优势。重点讲解了NumPy、Pandas、Matplotlib、Seaborn和Scikit-learn等必备工具,它们分别用于数值计算、数据处理、可视化和机器学习。此外,还概述了数据分析基本流程,从数据获取到结果展示。掌握这些知识和工具,有助于初学者快速入门Python数据分析。
108 2
|
2月前
|
机器学习/深度学习 数据可视化 数据挖掘
使用Python进行数据分析的入门指南
【8月更文挑战第29天】在数据驱动的时代,掌握数据分析技能变得尤为重要。本文将引导您了解如何使用Python这一强大工具来进行数据分析,从设置开发环境到实际操作案例,逐步深入,帮助您建立起数据分析的基本框架和思维模式。通过阅读本文,您将学会如何利用Python处理、分析和可视化数据,为进一步深入学习奠定坚实的基础。
|
3月前
|
机器学习/深度学习 数据采集 数据可视化
Python数据分析入门涉及基础如Python语言、数据分析概念及优势。
【7月更文挑战第5天】Python数据分析入门涉及基础如Python语言、数据分析概念及优势。关键工具包括NumPy(数组操作)、Pandas(数据处理)、Matplotlib(绘图)、Seaborn(高级可视化)和Scikit-learn(机器学习)。流程涵盖数据获取、清洗、探索、建模、评估和展示。学习和实践这些将助你有效利用数据。
42 2
|
4月前
|
数据采集 机器学习/深度学习 数据可视化
使用Jupyter Notebook进行数据分析:入门与实践
【6月更文挑战第5天】Jupyter Notebook是数据科学家青睐的交互式计算环境,用于创建包含代码、方程、可视化和文本的文档。本文介绍了其基本用法和安装配置,通过一个数据分析案例展示了如何使用Notebook进行数据加载、清洗、预处理、探索、可视化以及建模。Notebook支持多种语言,提供直观的交互体验,便于结果呈现和分享。它是高效数据分析的得力工具,初学者可通过本文案例开始探索。
|
2天前
|
机器学习/深度学习 数据可视化 数据挖掘
使用Python进行数据分析的入门指南
【9月更文挑战第33天】本文旨在为初学者提供一个关于使用Python进行数据分析的全面概述。我们将从基本的安装和设置开始,逐步介绍数据处理、数据可视化以及机器学习的基本概念和应用。文章将通过实际代码示例来展示如何使用Python及其相关库来解决常见的数据分析问题。
|
24天前
|
机器学习/深度学习 数据可视化 数据挖掘
深入浅出:使用Python进行数据分析的入门指南
【9月更文挑战第11天】本文旨在为初学者提供一条清晰的道路,通过Python探索数据科学的奇妙世界。我们将从基础语法讲起,逐步深入到数据处理、可视化以及机器学习等高级话题。文章不仅分享理论知识,还将通过实际代码示例,展示如何应用这些知识解决实际问题。无论你是编程新手,还是希望扩展技能的数据分析师,这篇文章都将是你宝贵的资源。
|
2月前
|
算法 数据挖掘 数据处理
豆瓣评分8.7!Python pandas创始人亲码的数据分析入门手册!
在众多解释型语言中,Python最大的特点是拥有一个巨大而活跃的科学计算社区。进入21世纪以来,在行业应用和学术研究中采用python进行科学计算的势头越来越猛。 近年来,由于Python有不断改良的库(主要是pandas),使其成为数据处理任务的一大代替方案,结合其在通用编程方面的强大实力,完全可以只使用Python这一种语言去构建以数据为中心的应用程序。 作为一个科学计算平台,Python的成功源于能够轻松的集成C、C++以及Fortran代码。大部分现代计算机环境都利用了一些Fortran和C库来是西安线性代数、优选、积分、快速傅里叶变换以及其他诸如此类的算法。
|
2月前
|
算法 数据挖掘 数据处理
豆瓣评分8.7!Python pandas创始人亲码的数据分析入门手册!
在众多解释型语言中,Python最大的特点是拥有一个巨大而活跃的科学计算社区。进入21世纪以来,在行业应用和学术研究中采用python进行科学计算的势头越来越猛。 近年来,由于Python有不断改良的库(主要是pandas),使其成为数据处理任务的一大代替方案,结合其在通用编程方面的强大实力,完全可以只使用Python这一种语言去构建以数据为中心的应用程序。 作为一个科学计算平台,Python的成功源于能够轻松的集成C、C++以及Fortran代码。大部分现代计算机环境都利用了一些Fortran和C库来是西安线性代数、优选、积分、快速傅里叶变换以及其他诸如此类的算法。
|
2月前
|
数据采集 数据可视化 算法
GitHub星标68K!Python数据分析入门手册带你从数据获取到可视化
Python作为一门优秀的编程语言,近年来受到很多编程爱好者的青睐。一是因为Python本身具有简捷优美、易学易用的特点;二是由于互联网的飞速发展,我们正迎来大数据的时代,而Python 无论是在数据的采集与处理方面,还是在数据分析与可视化方面都有独特的优势。我们可以利用 Python 便捷地开展与数据相关的项目,以很低的学习成本快速完成项目的研究。
|
2月前
|
数据采集 数据可视化 算法
GitHub星标68K!Python数据分析入门手册带你从数据获取到可视化
Python作为一门优秀的编程语言,近年来受到很多编程爱好者的青睐。一是因为Python本身具有简捷优美、易学易用的特点;二是由于互联网的飞速发展,我们正迎来大数据的时代,而Python 无论是在数据的采集与处理方面,还是在数据分析与可视化方面都有独特的优势。我们可以利用 Python 便捷地开展与数据相关的项目,以很低的学习成本快速完成项目的研究。 今天给小伙伴们分享的这份Python数据分析入门手册本着实用性的目的,着眼于整个数据分析的流程,介绍了从数据采集到可视化的大致流程。

热门文章

最新文章

下一篇
无影云桌面