分组与聚合|学习笔记

简介: 快速学习 分组与聚合

开发者学堂课程【Python 数据分析库 Pandas 快速入门:分组与聚合】学习笔记,与课程紧密联系,让用户快速学习知识。

课程地址:https://developer.aliyun.com/learning/course/607/detail/8866


分组与聚合


内容介绍:

一、什么是分组与聚合

二、如何在 pandas 进行分组与聚合:

三、案例:不同颜色不同笔的价格数据

四、星巴克零售店铺数据案例

 

l 什么是分组与聚合

分组与聚合通常是分析数据的一种方式,通常与一些统计函数一起使用,查看数据的分组情况。


l 如何在 pandas 进行分组与聚合:

通过 Dataframe 和 Series 两种方法都可实现

 

l 案例:不同颜色不同笔的价格数据

分组与聚合:

通过 dataframe 实现:col =pd. DataFrame({'color': ['white','red','green','red','green'],'object

进行分组,对颜色分组,price1 进行聚合# 用 dataframe 的方法进行分组

col.groupby(by="color")["pricel"].max()

通过 Series 实现:col["pricel"].groupby(col["color"]).max()


l 星巴克零售店铺数据案例

现在我们有一组关于全球星巴克店铺的统计数据,如果我想知道美国的星巴克数量和中国的哪个多,或者我想知道中国每个省份星巴克的数量的情况,那么应该怎么办?

数据来源:

https://www.kaggle.com/starbucks/store-locations/data

1 数据获取

从文件中读取星巴克店铺数据

#导入星巴克店的数据

starbucks =. pd. read_ csv ("directory. csv")

2进行分组聚合

# 按照国家分组,求出每个国家的星巴克零售店数量

count = starbucks. groupby ( [ 'Country']). count ()

画图显示结果

count['Brand'].plot(kind='bar',figsize=(20,8))plt.show ()

假设加入省市一起进行分组

# 设置多个索引,set_index()

starbucks.groupby(['Country','State/Province']).count()

相关文章
|
6月前
|
Serverless Python
分组和聚合DataFrame信息案例解析
该文介绍了如何使用pandas对DataFrame进行分组和聚合操作。首先,通过创建字典并转换为DataFrame,展示了基础数据结构。接着,利用`groupby()`方法按城市字段进行数据分组,然后应用`mean()`函数计算各城市平均年龄,显示了聚合功能。此外,文中指出还可使用`sum()`、`count()`等其他聚合函数处理分组数据。
75 0
|
18天前
|
存储 网络协议 Go
BGP路由聚合:自动聚合和手动聚合
【10月更文挑战第28天】
45 0
BGP路由聚合:自动聚合和手动聚合
|
2月前
如何优雅地对数据进行分组?
如何优雅地对数据进行分组?
35 0
|
5月前
|
BI
【Databend】分组集:教你如何快速分组汇总
【Databend】分组集:教你如何快速分组汇总
48 2
|
6月前
|
SQL 搜索推荐 数据库
8. 聚合查询
8. 聚合查询
DQL-分组聚合
DQL-分组聚合
30 0
|
关系型数据库
分组
GROUP BY 语句根据一个或多个列对结果集进行分组。
|
SQL 分布式计算 Java
聚合操作_groupBy_聚合操作 | 学习笔记
快速学习聚合操作_groupBy_聚合操作
131 0
聚合操作_groupBy_聚合操作 | 学习笔记
|
大数据 开发者
聚合操作_多维聚合_rollup | 学习笔记
快速学习聚合操作_多维聚合_rollup
聚合操作_多维聚合_rollup | 学习笔记
|
SQL 分布式计算 大数据
聚合操作_多维聚合_cubeSQL | 学习笔记
快速学习聚合操作_多维聚合_cubeSQL
119 0
聚合操作_多维聚合_cubeSQL | 学习笔记