小李是一家外企的数据分析师,平时处理的都是亿万行级别数据量的报表,为了可以胜任这份工作,小李早早地就学会了各种大数据工具,而且做出来的数据模型高度自动化,效率极高,为公司创造了非常大的价值。因为小李出色的表现,公司年底计划把他提升为公司的数据总监。
而小王是一家电商公司的数据专员,除了EXCEL其他的数据工具均不会,如果遇到数据量大的表格,小王就要和同事们一起去加班完成了。因此小王的工作效率非常低,领导也不止一次地去批评他,小王也感到很苦恼。小王进来公司三年了,期间只加过一次薪,而且加的幅度也不大。
通过小李和小王的对比可以看出,虽然两人都是从事着类似的工作,但是命运却截然不同,一个是拿着年薪几十万的职场精英,一个是拿着微薄工资职场小职员。那问题来了,为什么两个人做的事情差不多,待遇却有着天壤之别呢?
真正导致他们产生差距的原因,是他们对于处理数据的思维不一样,小李接触的是重量级的数据,遇到的问题多,自然就会去学习各种处理大数据的方法和手段,这个过程也是自我增值的过程。而小王对于EXCEL之外的数据处理方法知之甚少,做任何数据分析都只是停留在EXCEL的层面,所以遇到问题时很难突破这个瓶颈,只能望表兴叹了,怪不得毕业好几年了工资一直没怎么涨。哎,看来还是大数据比较香。那么大数据对于普通人来说好不好学呢,其实一点也不难,只要掌握了以下四点概念,我们一样也可以玩转大数据。
1、 数据连接
目前主要有两种数据数据存储的方式比较通用,一种是EXCEL或者CSV文件,直接保存在电脑里,需要用的话就直接打开,这也是很多中小企业做数据报表最直接的办法。还有一种就是外部数据库的连接,一般大型公司会用这种形式做做数据存储,因为数据量太大,每天的数据量可能在千万行以上,这个数据量是EXCEL无法承受的,因此用数据库做数据存储是最好的方法。
那么有没有两种方式都同时支持的系统呢?答案是有的,以下图的智分析为例,提供了EXCEL文件导入的入口,也支持市面上各种主流的数据库端口,一下子就把EXCEL的性能提升到了千万行的级别。
2、 EXCEL插件
作为一个职场小白,对于工具,最大的问题就是:不会用。这也是很多职场人员的真实写照,毕业好几年了,到头来只会用EXCEL一种工具。这里并不是贬低EXCEL的意思,而是工具对于工作效率来说太重要了,如果摆在你面前的是一份几千万行级别的数据报表,如果你用EXCEL处理的话,你会发现EXCEL根本无能为力,这个时候用其他的大数据工具会更现实。
所以除了EXCEL之外,我们也要学习其他更高级的工具。但是这些工具也并不是那么容易就入门,如果不花个一年半载,是没有办法完全掌握的,但是如果基于EXCEL去开发出一个可以处理大数据的插件,相信很多人都可以快速入门,如下图这个插件,只要连接好了数据库,或者在本地上传了文件,在EXCEL中便可以轻松处理千万行级的数据量。
3、 自助分析
要想在职场中混,有两个知识你必须得会,第一个是EXCEL的透视表,一个是数据库的查询语句,这两个知识都可以让你快速分析数据,得出分析结果。透视表相对来说简单一点,只要通过鼠标的拖拽就可以了,但是EXCEL透视表会有性能的限制,如果数据量太大的话,EXCEL的透视表便跑不动了,非常坑爹。所以我一般用智分析来做大数据的透视,在网页端便可以做透视图,而且没有数据量大小的限制。
如果你没学过数据库的话,写查询语句相对来说会难一点,因为这是一门系统的语言,需要一定的逻辑性。但是也有另外的一种方法,就是利用可视化的方式去做数据查询,例如在智分析上,就可以通过鼠标拖拽的方式去做数据查询,通过这样的方式可以快速建立好你的数据集,这样的好处就是不用写数据库查询语句,所有操作只需通过鼠标操作即可,非常方便,这个方法也叫即席查询。
4、 数据可视化
作为职场上的一名资深打工人,如果你还是只会用以下这种图形做报表的话,领导一定会吐槽这样的图表LOW爆了,连实习生做的图表都比你的好看。EXCEL虽然是一款小巧的数据工具,做图表也非常方便,但是如果要做厉害一点的数据可视化,EXCEL的能力还是偏弱一点。
所以,在大数据时代,正确的打开方式应该是像下面智分析做出来的报表一样,具有强大的定制和扩展能力,可以可视化建模,自助式分析,并具有高颜值的可视化效果。如果你能做出这么厉害的报表,领导一定会对你刮目相看,说不定年底的升职加薪就有你的份了。
“你在拼多多到处找人砍价,他在滴滴打车求人助力,我在电子厂拧螺丝拧到凌晨”,这是当代打工人对现实生活的无奈。同样地在职场上,优秀的打工人早已经开始了自我提升,学起了大数据,如果你还只是停留在EXCEL的层面上的话,对你未来的职业道路会非常局限,所以想要突破自我,就赶紧认认真真地学习一门处理大数据的工具吧。
智分析