你别笑我,我用EXCEL就可以做大数据

本文涉及的产品
云原生大数据计算服务 MaxCompute,5000CU*H 100GB 3个月
云原生大数据计算服务MaxCompute,500CU*H 100GB 3个月
简介: EXCEL是目前最主流的数据分析软件,这是由微软公司的背景以及其几十年来的技术沉淀所决定的,界面简单,功能强大,基于EXCEL去做数据分析是目前绝大部分公司的首要选择。虽然EXCEL目前拥有着最多的受众,但随着数据量的不断增大,每日动辄几百万行甚至上千万行的数据量,EXCEL已经无法应付这么庞大的数据量了,所以许多企业已经开始使用数据库或者BI工具去做数据分析了,因此EXCEL与BI、数据库如何相结合将会是未来一个崭新的课题。

Microsoft Excel是Microsoft为使用Windows和Apple Macintosh操作系统的电脑编写的一款电子表格软件。直观的界面、出色的计算功能和图表工具,再加上成功的市场营销,使Excel成为最流行的个人计算机数据处理软件。在1993年,作为Microsoft Office的组件发布了5.0版之后,Excel就开始成为所适用操作平台上的电子制表软件的霸主。截止至2017年,根据微软最新公布的数字显示,世界上有12 亿人使用微软办公软件,世界上每五个成年人中就有一个使用 Excel,足以显示该款软件的强大和普及性。
image.png
EXCEL是OFFICE的一个组件,全球市场占用率极高,可以说装了微软WINDOWS的PC几乎都装有它。EXCEL主要的作用是进行各种数据的处理、统计分析和辅助决策操作,广泛地应用于管理、统计财经、金融等众多领域,无论是国内还是国外,EXCE的身影都随处可见。
EXCEL是目前最主流的数据分析软件,这是由微软公司的背景以及其几十年来的技术沉淀所决定的,界面简单,功能强大,基于EXCEL去做数据分析是目前绝大部分公司的首要选择。虽然EXCEL目前拥有着最多的受众,但随着数据量的不断增大,每日动辄几百万行甚至上千万行的数据量,EXCEL已经无法应付这么庞大的数据量了,所以许多企业已经开始使用数据库或者BI工具去做数据分析了,因此EXCEL与BI、数据库如何相结合将会是未来一个崭新的课题。
在解决EXCEL的痛点问题前,我们先来看一下EXCEL的优缺点对比,从以下的对比中不难看出,EXCEL虽然上手简单,但是要去做一些大数据的处理时,总是会力不从心,已经不能适应信息时代高速发展的各种需求了。
优点:
• 新人友好度高,易于上手
• 使用方便,不需要多掌握一门操作语言
• 操作简单,学习成本低
缺点:
• 共享方面:excel是以电子表格形式进行大数据分析的,不易于数据共享。经常需要共享数据的人一定很崩溃。
• 数据源:当所需要的数据源有多个时,整合数据源非常麻烦,而且处理超过100万行的数据时非常慢,甚至会卡死。
• 可视化:excel可以完成基本的可视化操作。但是excel是静态的,数据有变动时操作麻烦。
EXCEL很多基础功能在我看来是非常好用的,毕竟是全世界中最普及的办公软件,做电子表格和数据可视化的能力都是杠杠的,那么如何不改变EXCEL的基础功能而提高EXCEL的处理能力呢?放眼整个数据行业,还真有一款叫做智分析的数据工具可以解决这些问题,通过其强大而又简洁的功能,可以为企业解决数据库连接、性能瓶颈等问题,其强大的数据处理能力弥补了EXCEL以往的种种缺陷,从而帮助企业解决更多实际工作场景中产生的问题。

智分析是嵌套在EXCEL里进行使用的,无需单独打开使用,只要安装好了,就像是POWER PIVOT一样出现在你的EXCEL工具栏里,与EXCEL结合的天衣无缝,非常简便。只要在工具栏中点击导入文件,便能把百万行甚至是千万行级的数据源导进去,这些数据源会保存在云端的数据库中,不会占用你电脑的内存,对于电脑配置低的同学来说,简直是一个天大的福利,从此再也不用把庞大的数据源保存在电脑里了,云端数据库便可以当成你的一个网络硬盘。

image.png
image.png
image.png
当需要调用数据源的时候怎么办呢?非常简单,点击工具栏中的视图,右边就会出现一个数据集面板,这里可以找到你保存在云端中的数据源,通过拖曳的方式,可以把数据源中的字段拖曳到EXCEL中进行分析,可以选择其中的几个字段,也可以选择多个字段,比EXCEL连接各种数据库的操作方便多了,没有任何技术门槛,只要你会使用EXCEL,就可以轻松上手。
image.png
如果需要补充新的数据源进去,可以在导入数据的界面里选择“添加到已有表”,就可以把数据追加进去了,然后在EXCEL中点击刷新,便可以实现数据自动更新。
image.png
智分析另外一个比较厉害的骚操作就是可以制作各种高大上的大屏图表,这些图表精致靓丽,颜色丰富,布局协调,如果你不会制作以下这种高大上的图表,你都不好意思说你是一名专业的数据分析人员。如果你做出一份这么高大上的图表拿给老板看,相信老板一定会对你另眼相看,是不是倍有面子呢?
image.png
除此之外,智分析还具有完善的安全管理体系,它可以控制用户功能权限、数据访问权限、资源访问权限。支持按用户、用户组、角色进行管理;支持多套应用系统共用同一套用户管理系统;支持多级用户管理体系。如果你的企业里存在着非常多角色用户,每个角色需要分配不一样的数据权限,那么智分析是绝对可以满足你的要求。
image.png
只有解决了EXCEL的弊端,才能更大地发挥EXCEL的使用价值,而智分析就是搭配EXCEL使用的一款利器,通过插件的形式嵌套在EXCEL中,解决了EXCEL数据性能、数据权限的难题,更把BI的元素融入到了EXCEL中,使你做出的报表更加美观,更能呈现出可指导业务的应用价值。
智分析入口

相关实践学习
基于MaxCompute的热门话题分析
本实验围绕社交用户发布的文章做了详尽的分析,通过分析能得到用户群体年龄分布,性别分布,地理位置分布,以及热门话题的热度。
SaaS 模式云数据仓库必修课
本课程由阿里云开发者社区和阿里云大数据团队共同出品,是SaaS模式云原生数据仓库领导者MaxCompute核心课程。本课程由阿里云资深产品和技术专家们从概念到方法,从场景到实践,体系化的将阿里巴巴飞天大数据平台10多年的经过验证的方法与实践深入浅出的讲给开发者们。帮助大数据开发者快速了解并掌握SaaS模式的云原生的数据仓库,助力开发者学习了解先进的技术栈,并能在实际业务中敏捷的进行大数据分析,赋能企业业务。 通过本课程可以了解SaaS模式云原生数据仓库领导者MaxCompute核心功能及典型适用场景,可应用MaxCompute实现数仓搭建,快速进行大数据分析。适合大数据工程师、大数据分析师 大量数据需要处理、存储和管理,需要搭建数据仓库?学它! 没有足够人员和经验来运维大数据平台,不想自建IDC买机器,需要免运维的大数据平台?会SQL就等于会大数据?学它! 想知道大数据用得对不对,想用更少的钱得到持续演进的数仓能力?获得极致弹性的计算资源和更好的性能,以及持续保护数据安全的生产环境?学它! 想要获得灵活的分析能力,快速洞察数据规律特征?想要兼得数据湖的灵活性与数据仓库的成长性?学它! 出品人:阿里云大数据产品及研发团队专家 产品 MaxCompute 官网 https://www.aliyun.com/product/odps 
相关文章
|
存储 easyexcel Java
阿里easyexcel解析百万级大数据量的Excel表格,看这一篇文章就够了
阿里easyexcel解析百万级大数据量的Excel表格,看这一篇文章就够了
阿里easyexcel解析百万级大数据量的Excel表格,看这一篇文章就够了
|
6月前
|
分布式计算 大数据 数据处理
MaxCompute操作报错合集之在本地用tunnel命令上传excel表格到mc遇到报错: tunnel upload C:\Users***\Desktop\a.xlsx mc里的非分区表名 -s false;该怎么办
MaxCompute是阿里云提供的大规模离线数据处理服务,用于大数据分析、挖掘和报表生成等场景。在使用MaxCompute进行数据处理时,可能会遇到各种操作报错。以下是一些常见的MaxCompute操作报错及其可能的原因与解决措施的合集。
|
XML 存储 安全
Excel电子表格的PHP类库:PHP_XLSXWriter(大数据量报表、后台运行、浏览器下载)
Excel电子表格的PHP类库:PHP_XLSXWriter(大数据量报表、后台运行、浏览器下载)
289 0
|
7月前
|
数据可视化 大数据 数据挖掘
最新Python大数据之Excel进阶
最新Python大数据之Excel进阶
93 0
|
存储 easyexcel 大数据
探索EasyExcel库:简化大数据Excel操作的利器
在企业应用和数据处理中,Excel表格是常用的数据交换和存储方式。然而,处理大量数据的Excel文件可能是一项繁琐的任务。EasyExcel库作为一款强大的Excel操作工具,可以帮助我们更轻松地进行大数据量的Excel文件读写、导入导出等操作。本文将深入探讨EasyExcel库的基本概念、特点,以及如何在实际应用中使用它进行Excel操作。
488 0
|
存储 easyexcel Java
springboot使用EasyExcel实现excel导出千万大数据量
# 介绍 EasyExcel是一个基于Java的、快速、简洁、解决大文件内存溢出的Excel处理工具。 他能让你在不用考虑性能、内存的等因素的情况下,快速完成Excel的读、写等功能。 Java解析、生成Excel比较有名的框架有Apache poi、jxl。但他们都存在一个严重的问题就是非常的耗内存,poi有一套SAX模式的API可以一定程度的解决一些内存溢出的问题,但POI还是有一些缺陷,比如07版Excel解压缩以及解压后存储都是在内存中完成的,内存消耗依然很大。 easyexcel重写了poi对07版Excel的解析,一个3M的excel用POI sax解析依然需要100M左右内存,
4450 0
|
分布式计算 关系型数据库 大数据
大批量处理excel文件到ODPS中方案
大批量处理excel文件到ODPS中方案 前言 最近所做的项目需要将近五千个excel文件导入到ODPS,并且excel文件内容格式全部不一样。 刚接到需求时特别的懵,不过工作还是要做的,首先通过查询dataworks中文档来看怎么实现该需求,通过文档了解到只支持csv、txt等格式进行单个上传,然后就开始着手做。
4284 0
|
数据采集 数据可视化 算法
2022年最新Python大数据之Excel基础
使用排序的方法删除重复项有一个问题,当数据是一串编码时,依然难以用肉眼看出重复的编码。
119 0
2022年最新Python大数据之Excel基础
|
分布式计算 MaxCompute
《大批量处理excel文件到ODPS中方案》电子版地址
大批量处理excel文件到ODPS中方案
112 0
《大批量处理excel文件到ODPS中方案》电子版地址
|
SQL 数据可视化 大数据
敢与大数据掰手腕,了解一下EXCEL的四宗“最”
大数据是近年来最热门的一个词,很多企业已经运用成熟的大数据技术去做企业管理,国家也在大力发展信息技术产业,大数据分析师更是招聘市场上炙手可热的香饽饽。但是大数据相关的工作岗位对数学、编程能力的要求都是比较高的,一般人很难在短时间内上手,大部分的人只会用一些最基本的办公软件去处理数据,例如EXCEL等。但是,你还千万别小瞧了EXCEL,虽然EXCEL有一定功能上的缺陷,但是麻雀虽小五脏俱全,应用非常广泛,是一款不可或缺的办公软件。那么究竟EXCEL能不能处理大数据呢?我们通过四宗“最”去了解一下。
敢与大数据掰手腕,了解一下EXCEL的四宗“最”