分组与聚合|学习笔记

简介: 快速学习 分组与聚合

开发者学堂课程【Python 数据分析库 Pandas 快速入门:分组与聚合】学习笔记,与课程紧密联系,让用户快速学习知识。

课程地址:https://developer.aliyun.com/learning/course/607/detail/8866


分组与聚合


内容介绍:

一、什么是分组与聚合

二、如何在 pandas 进行分组与聚合:

三、案例:不同颜色不同笔的价格数据

四、星巴克零售店铺数据案例

 

l 什么是分组与聚合

分组与聚合通常是分析数据的一种方式,通常与一些统计函数一起使用,查看数据的分组情况。


l 如何在 pandas 进行分组与聚合:

通过 Dataframe 和 Series 两种方法都可实现

 

l 案例:不同颜色不同笔的价格数据

分组与聚合:

通过 dataframe 实现:col =pd. DataFrame({'color': ['white','red','green','red','green'],'object

进行分组,对颜色分组,price1 进行聚合# 用 dataframe 的方法进行分组

col.groupby(by="color")["pricel"].max()

通过 Series 实现:col["pricel"].groupby(col["color"]).max()


l 星巴克零售店铺数据案例

现在我们有一组关于全球星巴克店铺的统计数据,如果我想知道美国的星巴克数量和中国的哪个多,或者我想知道中国每个省份星巴克的数量的情况,那么应该怎么办?

数据来源:

https://www.kaggle.com/starbucks/store-locations/data

1 数据获取

从文件中读取星巴克店铺数据

#导入星巴克店的数据

starbucks =. pd. read_ csv ("directory. csv")

2进行分组聚合

# 按照国家分组,求出每个国家的星巴克零售店数量

count = starbucks. groupby ( [ 'Country']). count ()

画图显示结果

count['Brand'].plot(kind='bar',figsize=(20,8))plt.show ()

假设加入省市一起进行分组

# 设置多个索引,set_index()

starbucks.groupby(['Country','State/Province']).count()

相关文章
|
11月前
|
算法 安全 数据建模
阿里云SSL证书限时优惠,WoSign DV证书220元/年起
2024年11月01日至11月30日,阿里云SSL证书限时优惠,部分证书产品新老同享75折起;阿里云用户通过完成个人或企业实名认证,还可领取不同额度的满减优惠券!通过优惠折扣、叠加满减优惠券等多种方式,阿里云WoSign SSL证书将实现优惠价格新低,DV SSL证书220元/年起!
890 5
阿里云SSL证书限时优惠,WoSign DV证书220元/年起
|
数据库 开发者 Java
颠覆传统开发:Hibernate与Spring Boot的集成,让你的开发效率飞跃式提升!
【8月更文挑战第31天】在 Java 开发中,Spring Boot 和 Hibernate 已成为许多开发者的首选技术栈。Spring Boot 简化了配置和部署过程,而 Hibernate 则是一个强大的 ORM 框架,用于管理数据库交互。将两者结合使用,可以极大提升开发效率并构建高性能的现代 Java 应用。本文将通过代码示例展示如何在 Spring Boot 项目中集成 Hibernate,并实现基本的数据库操作,包括添加依赖、配置数据源、创建实体类和仓库接口,以及在服务层和控制器中处理 HTTP 请求。这种组合不仅简化了配置,还提供了一套强大的工具来快速开发现代 Java 应用程序。
848 0
|
缓存 NoSQL 网络安全
【Azure Redis 缓存】 Python连接Azure Redis, 使用redis.ConnectionPool 出现 "ConnectionResetError: [Errno 104] Connection reset by peer"
【Azure Redis 缓存】 Python连接Azure Redis, 使用redis.ConnectionPool 出现 "ConnectionResetError: [Errno 104] Connection reset by peer"
219 0
|
存储 缓存 Linux
探索文件系统:高效、可靠的文件管理与访问机制
本篇文章探索了文件系统的功能规划,着重讨论了文件存储、索引节点和目录项的管理、缓存策略以及文件数据的存储等方面。文件系统作为计算机系统中重要的组成部分,对于实现高效、可靠的文件管理与访问机制至关重要。通过深入了解文件系统的基本单位、元信息记录和目录结构,我们可以更好地理解文件系统的工作原理,本文旨在为读者提供对文件系统功能规划的全面认识,以帮助他们更好地理解和应用文件系统相关的技术。
455 0
|
定位技术 Python
PowerShell批量修改、替换大量文件的文件名
PowerShell批量修改、替换大量文件的文件名
428 1
|
安全
如何设置Burpsuite中的代理,及安装安全证书
如何设置Burpsuite中的代理,及安装安全证书
258 0
|
消息中间件 监控 前端开发
我有 7种 实现web实时消息推送的方案,7种!
我有 7种 实现web实时消息推送的方案,7种!
3863 2
我有 7种 实现web实时消息推送的方案,7种!
|
JavaScript 索引
jquery操作select(取值,设置选中)
jquery操作select(取值,设置选中)
387 0
|
监控 安全 大数据
Dataphin V3.10升级速览丨集成能力提升、15个应用场景、数据治理能力优化……
Dataphin V3.10升级速览丨集成能力提升、15个应用场景、数据治理能力优化……
335 0
|
SQL 数据库
Unknown column ‘张三‘ in ‘where clause‘
Unknown column ‘张三‘ in ‘where clause‘
268 0