开发者社区> 华章计算机> 正文

《数据分析实战 基于EXCEL和SPSS系列工具的实践》一1.5 如何成为数据分析高手

简介: 在工作中接触数据比较多的朋友,由于提高工作效率的需要,或者考虑到职业发展前途,经常会关心一个问题:我怎么样成为一个数据分析高手?这种想法非常自然,如同一个下围棋的人经常会想“我怎么样成为围棋高手”一样。
+关注继续查看

本节书摘来自华章出版社《数据分析实战
基于EXCEL和SPSS系列工具的实践》一书中的第1章,第1.1节,纪贺元 著,更多章节内容可以访问云栖社区“华章计算机”公众号查看。

1.5 如何成为数据分析高手

在工作中接触数据比较多的朋友,由于提高工作效率的需要,或者考虑到职业发展前途,经常会关心一个问题:我怎么样成为一个数据分析高手?这种想法非常自然,如同一个下围棋的人经常会想“我怎么样成为围棋高手”一样。
根据我个人的理解,要想成为数据分析高手,要做到如下几个方面。

1.5.1 “拳不离手,曲不离口”

我培训的课程大概有10多门,不过课程的频度不同,有的课程一年要上好多遍,而有的课程相对比较冷门,一年也上不了几次。然后我就发现,那几个冷门课程,我每次上课之前都要备课,因为有些细节我忘记了。
项目中也是如此,自己写的系统代码,隔段时间不看了,就会有点看不懂了,需要静下心来仔细看一看。
所以,要成为数据分析的高手,第一要旨就是你工作中的数据很多,而且天天要做表、做分析,做得多了,自然熟练了,感觉也有了。
记得卖油翁的那句话吧:无他,唯手熟尔。

1.5.2 熟练掌握常用工具

“工欲善其事,必先利其器”,这话一点不假,身处信息时代的我们,掌握(尤其是熟练掌握)一些工具是非常有必要的。
第2章会比较详细地介绍统计分析工具,以下只是谈谈我自己的一些体会。
1.贵精不贵多
我曾经碰到过这样的人,他平时工作用EXCEL,也用VBA,根据我对他的了解,他的VBA用得一般,基本就是入门的级别吧。他报名去学习Matlab,也自学过R,2015年碰到他的时候,他说现在要考虑学Tableau。首先,我很赞赏和佩服他的学习精神,毕竟要学这么多东西,是要耗费很多时间和精力的(包括要花不少钱),但是,我绝对不赞成他的这种风格。要知道,对于一个分析工具的掌握需要长时间的学习和实践,有人说大部分人只掌握了EXCEL中5%的功能,我个人基本表示赞同。我使用VBA近20年,仍然觉得对VBA的很多功能还是知之甚少。再说,如果你熟练地掌握了一种工具,再学其他的也比较容易。
2.工具之间往往是互补的
我们需要掌握一个工具组合,一个有效的工具组合可以基本解决你的大部分问题。实际上,我在分析数据时,经常是多种工具一起使用。我会用EXCEL VBA表来收集数据,用EXCEL来预处理数据,用EXCEL数据透视表和SPSS来分析数据,用XLSTAT来做对应分析和决策树(因为我觉得XLSTAT虽然是个小工具,但是它在多重对应分析和决策树这两个模块上做得特别好),然后我会用clementine来处理关联分析。因此,“组合拳”还是很有必要的。

1.5.3 最好能编点程序

记得曾经看过一篇文章,写的是在美国,很多小孩都能编点简单的程序,有的小学生甚至能够熟练地掌握双重循环,也就是说,编程这个技巧,起码在美国,大家没认为它是一个很高端的技能。
国内的情况则大大不同,个人的感觉是很多企业人员对编程都比较害怕,甚至到了恐惧的程度。我曾经在班上问过一些学员,在大学的时候有没有学过编程,有1/3的学员举手。实际上,现在的大学在大一的基础课中是有VB和C语言的。不过即使这样,我仍然觉得很多学员包括学过VB或C语言的学员都不大喜欢或者不大愿意去接触编程。
我们的很多学员,还没有开始编程,就已经掉头撤退了,他们已经把自己归类到不可能学会编程的那个行列中去了!
本书的主旨不是探讨为什么很多有点编程基础的人不愿意编程,这里想说的是,编程技能几乎是数据分析高手的必备技能。如果学会一种编程语言将极大地提高数据分析的能力,如果精通的话那实在是太棒了。
试想,人家在跑代码,而你是手工做数据,这可是天壤之别!数据量大到一定程度,步骤多到一定程度,手工就没法做了。

1.5.4 一定要通晓业务

做数据分析,不能为了做分析而分析,做数据分析的出发点是业务需求,例如,我们要做商务预测,或者我们要找到有兴趣购买我们产品的客户,因此但凡是数据分析高手,基本上都有两个特征:一是懂业务,二是会做数据。
曾经有企业领导问我,他们要建一个数据团队,如何组建?我跟他说,不管你是内部选拔还是外部招聘,建议你团队里面一定要有几个从业务口出来的人,这几个人懂业务,跟企业其他人员也熟,沟通、交流都方便。后来,我得知,他们的数据团队有两个副经理,一个是偏业务的内部人员出身,一个是外部招聘的统计学硕士,我觉得这个设置比较合理。

版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。

相关文章
干货 | H5性能分析实战来啦~
![](https://ceshiren.com/uploads/default/original/3X/9/f/9f1091a2de1d0f0bf718036424b512c9677b9a1c.jpeg) H5性能该如何测试呢?很多人不知道该如何下手。其实可以借用W3C协议完成自动化H5性能测试。 因为W3C标准是浏览器标准,一般浏览器都支持W3C标准,它规定使用者可以通过api查询性能信息
38 0
数据分析复盘报告,用Excel轻松搞掂!
大家好,我是爱学习的小xiong熊妹。 才6月第一周,我的领导,作为大厂的得力基层领导,就迫不及待地让我开始写上半年复盘报告了,我真的是一口气差点上不来~ 我们知道,做数据分析一般有3个场景: 事前:策划类分析、预测类分析 事中:监控类分析、原因类分析 事后:总结性分析 到了6月份,有很多的半年总结、季度总结要做,618大促销的总结也要做。估计近期事后总结性分析报告(或者叫复盘报告)非常多,今天小熊妹就为大家整理了复盘报告的极简分析思路,帮助还在苦苦憋报告的小伙伴们早日脱离苦海哦。
26 0
HBase BulkLoad批量写入数据实战
1.概述 在进行数据传输中,批量加载数据到HBase集群有多种方式,比如通过HBase API进行批量写入数据、使用Sqoop工具批量导数到HBase集群、使用MapReduce批量导入等。这些方式,在导入数据的过程中,如果数据量过大,可能耗时会比较严重或者占用HBase集群资源较多(如磁盘IO、HBase Handler数等)。
1635 0
基于对象存储 OSS 的智能数据分析处理框架和功能
今年参加了 2019 全球闪存峰会(Flash Memory World),分享了“基于云存储的智能数据分析处理架构”,重点介绍在对象存储 OSS 之上的数据处理功能,现整理相关内容和大家探讨。
2302 0
基于Numpy的统计分析实战
标题中的英文首字母大写比较规范,但在python实际使用中均为小写。 2018年7月27日笔记 学习内容: 1.从文件中读取数据 2.将数据写入文件 3.利用数学和统计分析函数完成实际统计分析应用 4.掌握数组相关的常用函数 1.文本文件读写 1.1使用numpy.savetxt方法写入文本文件 numpy.savetxt方法需要2个参数:第1个参数是文件名,数据类型为字符串str; 第2个参数是被写入文件的nda数据,数据类型为ndarray对象。
1083 0
用C#写一个实现进程监控的自动关机工具
今天QA部门需要进行Performance测试,因为跑job的时间会很长,下班也跑不完。所以想要做一个job运行完毕自动关机的工具。 原理就是检查进程的名称,如果检查不到相应的进程,就说明job已经跑完了,可以关机了。
878 0
解析实时的DB time过程分析
在我们查看awr报告的时候总是会有一个关键指标需要注意,那就是DB time,这个指标一般都是通过awr报告来看到的。 比如我们得到的awr报告头部显示的下面的信息,我们就清楚的知道DB time是1502.06 mins,相对于Elapsed time来说,将近有20倍的压力。
653 0
10059
文章
0
问答
来源圈子
更多
+ 订阅
文章排行榜
最热
最新
相关电子书
更多
OceanBase 入门到实战教程
立即下载
阿里云图数据库GDB,加速开启“图智”未来.ppt
立即下载
实时数仓Hologres技术实战一本通2.0版(下)
立即下载