业务数据分析-Excel数据透视表(四)

简介: 业务数据分析-Excel数据透视表(四)

1、什么是数据透视表


先来举个例子

看下面这段对话

下午5点30

boss:把这张表给我整理成如下格式,就是根据平台给我汇总一下销量和收入,我要做个数据统计

187154e3ffb14279b41e4710df59757b.png


同学们,你们接到这样的需求之后,有什么想法呢?


哈哈,第一个想法肯定是,我滴妈呀,为啥临到下班点给我派活,一天都干啥去了,是逼我加班么,这是什么boss,真够讨厌的。


以上是开玩笑的啦,同学们都是积极上进的好同志,一般不会这么想的吧,肯定是在想解决方案,我该怎么操作。


那接下来就看看怎么解决这个问题


青铜:好办,在源表中按照品牌一个一个筛选,然后用函数sum计算求和,把结果粘到汇总表中即可,这种办法可行,那估计今天晚上到家又得10点了,然后觉得自己工作好忙,好累。


黄金:使用sumif条件求和函数,利用地址引用功能实现,若需要核对数据之类的,下班前轻松搞定,能准点回家,吃上一顿美美的晚餐。


王者:数据透视,三下五除二,拖拉拽就搞定了,只要数据源没问题,最多5分钟,下班前还能处理这样类似的数据6到7份没问题的,准点回家还能再学点python编程啥的,看以后能够使用脚本自动化实现。


e1c2069f0467461e9ac824a1d963db1b.png

7d84e0382efa4ea0a23c7f128d0b71d4.png


2、如何操作


创建数据透视表

  • 选择数据源区域中的任意单元格
  • 点击工具栏中的【插入】
  • 选择插入下方的【数据透视表】
  • 在弹出的创建数据透视表窗口,点击【确定】
  • 选择列、行、值字段分别拖拽到下方对应区域

图解:

142b4a3b5c044b23b29182c7f4efd5f6.png

a31cf4922ca54580a62b09af8b1f1e46.png

87b8d04af2cb48d38917e3ab55b74db8.png


可以选择不同的汇总方式


那什么是数据透视表呢?


简单来说就是把明细表进行分类汇总的过程,你可以按照不同的组合方式进行数据计算。

操作很简单,一学就会!


3、数据透视表的优势


首先体会数据透视表的优势:快速、高效、灵活。


在处理成千上万条数据的情况下,函数运算数据太多,表格容易卡顿,相比函数需要一条条手动设置公式,计算慢、繁琐的缺陷,数据透视表通过简单的拖拽就能完成各个维度你想要的数据分类汇总,可以说是基础的Excel操作里面最简单易上手,最实用,最常用的功能了。


4、适用什么场景


其实主要是用于计算数据的

1、有大量的数据,使用函数计算慢、繁琐

2、希望快速制作、整理、分析各类报表

3、数据源经常发生变化,并且要经常分析和处理最新的数据

4、想快速洞察数据背后隐藏的意义


5、使用前注意事项


用数据透视表,对原始数据是有一定要求的


数据透视表创建之前,要先做好前期数据整理。数据透视表的威力虽然无比强大,但使用前提是数据源要规范,否则会给后期创建和使用数据透视表带来层层阻碍,甚至无法创建数据透视表。


数据规范就是要检查,避免数据源出现以下的问题:


1、不能包含空字段 (包含空字段,无法制作数据透视表)


2、不包含相同字段 (相同的字段名,会自动添加序号,以示区别)


3、不能有合并单元格 (字段所在行有合并单元格,等同于空字段,也无法创建数据透视表)


4、不能有空行(如果有空行,会当成空值处理)


5、不包含有文本型数字(文本型数字会导致汇总求和的结果错误)


所以我们在创建透视表的时候出问题,绝大多数情况下需要我们去检查数据源,排除是否存在上面的问题。

目录
相关文章
|
6天前
|
数据采集 数据可视化 数据挖掘
Pandas数据应用:天气数据分析
本文介绍如何使用 Pandas 进行天气数据分析。Pandas 是一个强大的 Python 数据处理库,适合处理表格型数据。文章涵盖加载天气数据、处理缺失值、转换数据类型、时间序列分析(如滚动平均和重采样)等内容,并解决常见报错如 SettingWithCopyWarning、KeyError 和 TypeError。通过这些方法,帮助用户更好地进行气候趋势预测和决策。
98 71
|
1月前
|
数据采集 数据可视化 数据挖掘
利用Python自动化处理Excel数据:从基础到进阶####
本文旨在为读者提供一个全面的指南,通过Python编程语言实现Excel数据的自动化处理。无论你是初学者还是有经验的开发者,本文都将帮助你掌握Pandas和openpyxl这两个强大的库,从而提升数据处理的效率和准确性。我们将从环境设置开始,逐步深入到数据读取、清洗、分析和可视化等各个环节,最终实现一个实际的自动化项目案例。 ####
101 10
|
5天前
|
存储 数据采集 数据可视化
Pandas数据应用:电子商务数据分析
本文介绍如何使用 Pandas 进行电子商务数据分析,涵盖数据加载、清洗、预处理、分析与可视化。通过 `read_csv` 等函数加载数据,利用 `info()` 和 `describe()` 探索数据结构和统计信息。针对常见问题如缺失值、重复记录、异常值等,提供解决方案,如 `dropna()`、`drop_duplicates()` 和正则表达式处理。结合 Matplotlib 等库实现数据可视化,探讨内存不足和性能瓶颈的应对方法,并总结常见报错及解决策略,帮助提升电商企业的数据分析能力。
101 73
|
3月前
|
数据采集 存储 JavaScript
自动化数据处理:使用Selenium与Excel打造的数据爬取管道
本文介绍了一种使用Selenium和Excel结合代理IP技术从WIPO品牌数据库(branddb.wipo.int)自动化爬取专利信息的方法。通过Selenium模拟用户操作,处理JavaScript动态加载页面,利用代理IP避免IP封禁,确保数据爬取稳定性和隐私性。爬取的数据将存储在Excel中,便于后续分析。此外,文章还详细介绍了Selenium的基本设置、代理IP配置及使用技巧,并探讨了未来可能采用的更多防反爬策略,以提升爬虫效率和稳定性。
175 4
|
2天前
|
存储 数据采集 数据可视化
Pandas数据应用:医疗数据分析
Pandas是Python中强大的数据操作和分析库,广泛应用于医疗数据分析。本文介绍了使用Pandas进行医疗数据分析的常见问题及解决方案,涵盖数据导入、预处理、清洗、转换、可视化等方面。通过解决文件路径错误、编码不匹配、缺失值处理、异常值识别、分类变量编码等问题,结合Matplotlib等工具实现数据可视化,并提供了解决常见报错的方法。掌握这些技巧可以提高医疗数据分析的效率和准确性。
39 22
|
4月前
|
数据挖掘 PyTorch TensorFlow
|
2月前
|
存储 机器学习/深度学习 数据可视化
数据集中存在大量的重复值,会对后续的数据分析和处理产生什么影响?
数据集中存在大量重复值可能会对后续的数据分析和处理产生多方面的负面影响
128 56
|
6天前
|
数据采集 数据可视化 索引
Pandas数据应用:股票数据分析
本文介绍了如何使用Pandas库进行股票数据分析。首先,通过pip安装并导入Pandas库。接着,从本地CSV文件读取股票数据,并解决常见的解析错误。然后,利用head()、info()等函数查看数据基本信息,进行数据清洗,处理缺失值和重复数据。再者,结合Matplotlib和Seaborn进行数据可视化,绘制收盘价折线图。最后,进行时间序列分析,设置日期索引、重采样和计算移动平均线。通过这些步骤,帮助读者掌握Pandas在股票数据分析中的应用。
37 5
|
9天前
|
存储 Java easyexcel
招行面试:100万级别数据的Excel,如何秒级导入到数据库?
本文由40岁老架构师尼恩撰写,分享了应对招商银行Java后端面试绝命12题的经验。文章详细介绍了如何通过系统化准备,在面试中展示强大的技术实力。针对百万级数据的Excel导入难题,尼恩推荐使用阿里巴巴开源的EasyExcel框架,并结合高性能分片读取、Disruptor队列缓冲和高并发批量写入的架构方案,实现高效的数据处理。此外,文章还提供了完整的代码示例和配置说明,帮助读者快速掌握相关技能。建议读者参考《尼恩Java面试宝典PDF》进行系统化刷题,提升面试竞争力。关注公众号【技术自由圈】可获取更多技术资源和指导。
|
18天前
|
数据采集 监控 数据挖掘
常用电商商品数据API接口(item get)概述,数据分析以及上货
电商商品数据API接口(item get)是电商平台上用于提供商品详细信息的接口。这些接口允许开发者或系统以编程方式获取商品的详细信息,包括但不限于商品的标题、价格、库存、图片、销量、规格参数、用户评价等。这些信息对于电商业务来说至关重要,是商品数据分析、价格监控、上货策略制定等工作的基础。