本节书摘来自华章计算机《数据分析实战:基于EXCEL和SPSS系列工具的实践》一书中的第1章,第1.5节,作者 纪贺元,更多章节内容可以访问云栖社区“华章计算机”公众号查看。
1.5 如何成为数据分析高手
在工作中接触数据比较多的朋友,由于提高工作效率的需要,或者考虑到职业发展前途,经常会关心一个问题:我怎么样成为一个数据分析高手?这种想法非常自然,如同一个下围棋的人经常会想“我怎么样成为围棋高手”一样。
根据我个人的理解,要想成为数据分析高手,要做到如下几个方面。
1.5.1 “拳不离手,曲不离口”
我培训的课程大概有10多门,不过课程的频度不同,有的课程一年要上好多遍,而有的课程相对比较冷门,一年也上不了几次。然后我就发现,那几个冷门课程,我每次上课之前都要备课,因为有些细节我忘记了。
项目中也是如此,自己写的系统代码,隔段时间不看了,就会有点看不懂了,需要静下心来仔细看一看。
所以,要成为数据分析的高手,第一要旨就是你工作中的数据很多,而且天天要做表、做分析,做得多了,自然熟练了,感觉也有了。
记得卖油翁的那句话吧:无他,唯手熟尔。
1.5.2 熟练掌握常用工具
“工欲善其事,必先利其器”,这话一点不假,身处信息时代的我们,掌握(尤其是熟练掌握)一些工具是非常有必要的。
第2章会比较详细地介绍统计分析工具,以下只是谈谈我自己的一些体会。
1.贵精不贵多
我曾经碰到过这样的人,他平时工作用EXCEL,也用VBA,根据我对他的了解,他的VBA用得一般,基本就是入门的级别吧。他报名去学习Matlab,也自学过R,2015年碰到他的时候,他说现在要考虑学Tableau。首先,我很赞赏和佩服他的学习精神,毕竟要学这么多东西,是要耗费很多时间和精力的(包括要花不少钱),但是,我绝对不赞成他的这种风格。要知道,对于一个分析工具的掌握需要长时间的学习和实践,有人说大部分人只掌握了EXCEL中5%的功能,我个人基本表示赞同。我使用VBA近20年,仍然觉得对VBA的很多功能还是知之甚少。再说,如果你熟练地掌握了一种工具,再学其他的也比较容易。
2.工具之间往往是互补的
我们需要掌握一个工具组合,一个有效的工具组合可以基本解决你的大部分问题。实际上,我在分析数据时,经常是多种工具一起使用。我会用EXCEL VBA表来收集数据,用EXCEL来预处理数据,用EXCEL数据透视表和SPSS来分析数据,用XLSTAT来做对应分析和决策树(因为我觉得XLSTAT虽然是个小工具,但是它在多重对应分析和决策树这两个模块上做得特别好),然后我会用clementine来处理关联分析。因此,“组合拳”还是很有必要的。
1.5.3 最好能编点程序
记得曾经看过一篇文章,写的是在美国,很多小孩都能编点简单的程序,有的小学生甚至能够熟练地掌握双重循环,也就是说,编程这个技巧,起码在美国,大家没认为它是一个很高端的技能。
国内的情况则大大不同,个人的感觉是很多企业人员对编程都比较害怕,甚至到了恐惧的程度。我曾经在班上问过一些学员,在大学的时候有没有学过编程,有1/3的学员举手。实际上,现在的大学在大一的基础课中是有VB和C语言的。不过即使这样,我仍然觉得很多学员包括学过VB或C语言的学员都不大喜欢或者不大愿意去接触编程。
我们的很多学员,还没有开始编程,就已经掉头撤退了,他们已经把自己归类到不可能学会编程的那个行列中去了!
本书的主旨不是探讨为什么很多有点编程基础的人不愿意编程,这里想说的是,编程技能几乎是数据分析高手的必备技能。如果学会一种编程语言将极大地提高数据分析的能力,如果精通的话那实在是太棒了。
试想,人家在跑代码,而你是手工做数据,这可是天壤之别!数据量大到一定程度,步骤多到一定程度,手工就没法做了。
1.5.4 一定要通晓业务
做数据分析,不能为了做分析而分析,做数据分析的出发点是业务需求,例如,我们要做商务预测,或者我们要找到有兴趣购买我们产品的客户,因此但凡是数据分析高手,基本上都有两个特征:一是懂业务,二是会做数据。
曾经有企业领导问我,他们要建一个数据团队,如何组建?我跟他说,不管你是内部选拔还是外部招聘,建议你团队里面一定要有几个从业务口出来的人,这几个人懂业务,跟企业其他人员也熟,沟通、交流都方便。后来,我得知,他们的数据团队有两个副经理,一个是偏业务的内部人员出身,一个是外部招聘的统计学硕士,我觉得这个设置比较合理。