同样都是打工人,为何别人会建模,而你只会用EXCEL?

简介: 目前主要有两种数据数据存储的方式比较通用,一种是EXCEL或者CSV文件,直接保存在电脑里,需要用的话就直接打开,这也是很多中小企业做数据报表最直接的办法。还有一种就是外部数据库的连接,一般大型公司会用这种形式做做数据存储,因为数据量太大,每天的数据量可能在千万行以上,这个数据量是EXCEL无法承受的,因此用数据库做数据存储是最好的方法

小李是一家外企的数据分析师,平时处理的都是亿万行级别数据量的报表,为了可以胜任这份工作,小李早早地就学会了各种大数据工具,而且做出来的数据模型高度自动化,效率极高,为公司创造了非常大的价值。因为小李出色的表现,公司年底计划把他提升为公司的数据总监。
而小王是一家电商公司的数据专员,除了EXCEL其他的数据工具均不会,如果遇到数据量大的表格,小王就要和同事们一起去加班完成了。因此小王的工作效率非常低,领导也不止一次地去批评他,小王也感到很苦恼。小王进来公司三年了,期间只加过一次薪,而且加的幅度也不大。
通过小李和小王的对比可以看出,虽然两人都是从事着类似的工作,但是命运却截然不同,一个是拿着年薪几十万的职场精英,一个是拿着微薄工资职场小职员。那问题来了,为什么两个人做的事情差不多,待遇却有着天壤之别呢?
真正导致他们产生差距的原因,是他们对于处理数据的思维不一样,小李接触的是重量级的数据,遇到的问题多,自然就会去学习各种处理大数据的方法和手段,这个过程也是自我增值的过程。而小王对于EXCEL之外的数据处理方法知之甚少,做任何数据分析都只是停留在EXCEL的层面,所以遇到问题时很难突破这个瓶颈,只能望表兴叹了,怪不得毕业好几年了工资一直没怎么涨。哎,看来还是大数据比较香。那么大数据对于普通人来说好不好学呢,其实一点也不难,只要掌握了以下四点概念,我们一样也可以玩转大数据。
1、 数据连接
目前主要有两种数据数据存储的方式比较通用,一种是EXCEL或者CSV文件,直接保存在电脑里,需要用的话就直接打开,这也是很多中小企业做数据报表最直接的办法。还有一种就是外部数据库的连接,一般大型公司会用这种形式做做数据存储,因为数据量太大,每天的数据量可能在千万行以上,这个数据量是EXCEL无法承受的,因此用数据库做数据存储是最好的方法。
那么有没有两种方式都同时支持的系统呢?答案是有的,以下图的智分析为例,提供了EXCEL文件导入的入口,也支持市面上各种主流的数据库端口,一下子就把EXCEL的性能提升到了千万行的级别。
image.png
2、 EXCEL插件
作为一个职场小白,对于工具,最大的问题就是:不会用。这也是很多职场人员的真实写照,毕业好几年了,到头来只会用EXCEL一种工具。这里并不是贬低EXCEL的意思,而是工具对于工作效率来说太重要了,如果摆在你面前的是一份几千万行级别的数据报表,如果你用EXCEL处理的话,你会发现EXCEL根本无能为力,这个时候用其他的大数据工具会更现实。
所以除了EXCEL之外,我们也要学习其他更高级的工具。但是这些工具也并不是那么容易就入门,如果不花个一年半载,是没有办法完全掌握的,但是如果基于EXCEL去开发出一个可以处理大数据的插件,相信很多人都可以快速入门,如下图这个插件,只要连接好了数据库,或者在本地上传了文件,在EXCEL中便可以轻松处理千万行级的数据量。
image.png
3、 自助分析
要想在职场中混,有两个知识你必须得会,第一个是EXCEL的透视表,一个是数据库的查询语句,这两个知识都可以让你快速分析数据,得出分析结果。透视表相对来说简单一点,只要通过鼠标的拖拽就可以了,但是EXCEL透视表会有性能的限制,如果数据量太大的话,EXCEL的透视表便跑不动了,非常坑爹。所以我一般用智分析来做大数据的透视,在网页端便可以做透视图,而且没有数据量大小的限制。
image.png
如果你没学过数据库的话,写查询语句相对来说会难一点,因为这是一门系统的语言,需要一定的逻辑性。但是也有另外的一种方法,就是利用可视化的方式去做数据查询,例如在智分析上,就可以通过鼠标拖拽的方式去做数据查询,通过这样的方式可以快速建立好你的数据集,这样的好处就是不用写数据库查询语句,所有操作只需通过鼠标操作即可,非常方便,这个方法也叫即席查询。
image.png
4、 数据可视化
作为职场上的一名资深打工人,如果你还是只会用以下这种图形做报表的话,领导一定会吐槽这样的图表LOW爆了,连实习生做的图表都比你的好看。EXCEL虽然是一款小巧的数据工具,做图表也非常方便,但是如果要做厉害一点的数据可视化,EXCEL的能力还是偏弱一点。
image.png
所以,在大数据时代,正确的打开方式应该是像下面智分析做出来的报表一样,具有强大的定制和扩展能力,可以可视化建模,自助式分析,并具有高颜值的可视化效果。如果你能做出这么厉害的报表,领导一定会对你刮目相看,说不定年底的升职加薪就有你的份了。
image.png
image.png
image.png
“你在拼多多到处找人砍价,他在滴滴打车求人助力,我在电子厂拧螺丝拧到凌晨”,这是当代打工人对现实生活的无奈。同样地在职场上,优秀的打工人早已经开始了自我提升,学起了大数据,如果你还只是停留在EXCEL的层面上的话,对你未来的职业道路会非常局限,所以想要突破自我,就赶紧认认真真地学习一门处理大数据的工具吧。
智分析

相关实践学习
基于MaxCompute的热门话题分析
本实验围绕社交用户发布的文章做了详尽的分析,通过分析能得到用户群体年龄分布,性别分布,地理位置分布,以及热门话题的热度。
SaaS 模式云数据仓库必修课
本课程由阿里云开发者社区和阿里云大数据团队共同出品,是SaaS模式云原生数据仓库领导者MaxCompute核心课程。本课程由阿里云资深产品和技术专家们从概念到方法,从场景到实践,体系化的将阿里巴巴飞天大数据平台10多年的经过验证的方法与实践深入浅出的讲给开发者们。帮助大数据开发者快速了解并掌握SaaS模式的云原生的数据仓库,助力开发者学习了解先进的技术栈,并能在实际业务中敏捷的进行大数据分析,赋能企业业务。 通过本课程可以了解SaaS模式云原生数据仓库领导者MaxCompute核心功能及典型适用场景,可应用MaxCompute实现数仓搭建,快速进行大数据分析。适合大数据工程师、大数据分析师 大量数据需要处理、存储和管理,需要搭建数据仓库?学它! 没有足够人员和经验来运维大数据平台,不想自建IDC买机器,需要免运维的大数据平台?会SQL就等于会大数据?学它! 想知道大数据用得对不对,想用更少的钱得到持续演进的数仓能力?获得极致弹性的计算资源和更好的性能,以及持续保护数据安全的生产环境?学它! 想要获得灵活的分析能力,快速洞察数据规律特征?想要兼得数据湖的灵活性与数据仓库的成长性?学它! 出品人:阿里云大数据产品及研发团队专家 产品 MaxCompute 官网 https://www.aliyun.com/product/odps 
相关文章
|
6天前
|
监控 数据可视化 项目管理
WBS任务分解拆解:项目管理中的效率秘诀探讨
WBS(Work Breakdown Structure)是项目管理中将大型复杂项目分解为可管理的小任务的方法。它帮助清晰定义项目目标,确保100%覆盖所有工作,并遵循任务独立性及适当工作包大小原则。WBS通过简化项目、明确责任人、制定工作清单、估算时间和分配资源,促进项目跟踪与控制。使用工具如Zoho Projects,可按阶段创建任务,细化子任务,设定依赖关系,分配资源,以及设置提醒和里程碑,从而有效管理项目执行。
21 1
|
域名解析 XML 监控
测试打工人如何学习
处在职场中的测试人不知如何学习?不妨看看这篇。
132 0
测试打工人如何学习
【Office】【Excel】将多个工作薄合为一个工作薄
【Office】【Excel】将多个工作薄合为一个工作薄
130 0
|
机器学习/深度学习 数据处理 Python
2022年全国大学生数学建模竞赛E题目-小批量物料生产安排详解+思路+Python代码时序预测模型(三)
2022年全国大学生数学建模竞赛E题目-小批量物料生产安排详解+思路+Python代码时序预测模型(三)
733 1
2022年全国大学生数学建模竞赛E题目-小批量物料生产安排详解+思路+Python代码时序预测模型(三)
|
算法 Python
2022年全国大学生数学建模竞赛E题目-小批量物料生产安排详解+思路+Python代码时序预测模型(二)
2022年全国大学生数学建模竞赛E题目-小批量物料生产安排详解+思路+Python代码时序预测模型(二)
496 0
2022年全国大学生数学建模竞赛E题目-小批量物料生产安排详解+思路+Python代码时序预测模型(二)
|
算法 Python
2022年全国大学生数学建模竞赛E题目-小批量物料生产安排详解+思路+Python代码时序预测模型(一)
2022年全国大学生数学建模竞赛E题目-小批量物料生产安排详解+思路+Python代码时序预测模型(一)
550 0
2022年全国大学生数学建模竞赛E题目-小批量物料生产安排详解+思路+Python代码时序预测模型(一)
|
机器学习/深度学习 Python
2022年全国大学生数学建模竞赛E题目-小批量物料生产安排详解+思路+Python代码时序预测模型(四)
2022年全国大学生数学建模竞赛E题目-小批量物料生产安排详解+思路+Python代码时序预测模型(四)
595 1
2022年全国大学生数学建模竞赛E题目-小批量物料生产安排详解+思路+Python代码时序预测模型(四)
2022国赛E题小批量物料的生产安排思路分析
2022国赛E题小批量物料的生产安排思路分析
相亲软件开发,与数据加载相关的三个层次的思考
相亲软件开发,与数据加载相关的三个层次的思考