groupby 操作|学习笔记

简介: 快速学习 groupby 操作

开发者学堂课程【Python 常用数据科学库:groupby 操作】学习笔记,与课程紧密联系,让用户快速学习知识

课程地址https://developer.aliyun.com/learning/course/546/detail/7480


groupby 操作


1.定义:

在使用 python 进行数据分析的过程中,采用 groupby 函数对数据进行分组是一项很常用的操作,它可以帮助我们更清晰地了解我们所用数据的组成及规律,本节将为大家简单介绍一下如果使用 groupby 函数对数据进行分组的具体做法。

In [1]: import pandas as pd

df = pd.DataFrame({'key':['A','B','C','A','B','C','A','B','C'],

'data': [0, 5, 10, 5, 10, 15, 10, 15, 20]})

Df

image.png

//key 相当于一个标签,'A','B','C'相当于三个品牌,把 key 传进去,看看对应当前key 是不是一样的,之后把 key 回传到索引中,最后求出 sum 和。由此可以看出ABC 的累加和,是45.

In [2]: for key in ['A','B','C']:

print (key,df [df['key'] == key].sum())

image.png

image.png

先写一个函数,split 将前面的分成三块A B C ,然后 apply 进行分组算和,最后加在一起。

//用 groupby 的方法,快速简单得到和。这样在数据上做一些数据统计就比较方便,还可以指定 numpy 的操作,那样就不是 sum,而是 aggregate。总值平均值都可以求。

In [3]: df.groupby('key').sum()

image.png

In [5]:import numpy as np

df. groupby('key').aggregate (np. sum)

image.png

In [6]:import numpy as np

df.groupby('key').aggregate (np.mean)

image.png

In [7]: df = pd.read_csv(‘./data/titanic.csv')

In [8]: df. groupby ('Sex') ['Age'].mean()

image.png

//查看男性和女性的年龄

In [10]: df. groupby('Sex') ['Survived']. mean()

//统计男性女性的获救概率

//执行这样的操作非常方便,就是用格外统计数据来说,可以统计数据当中,很多个指标进行分析。

2.操作步骤:

(1)、分缩,(2)、打开,(3)、结合

相关文章
|
机器学习/深度学习 索引 Python
技术经验分享:DataFrame(1):结构介绍
技术经验分享:DataFrame(1):结构介绍
497 0
|
4天前
|
存储 关系型数据库 分布式数据库
PostgreSQL 18 发布,快来 PolarDB 尝鲜!
PostgreSQL 18 发布,PolarDB for PostgreSQL 全面兼容。新版本支持异步I/O、UUIDv7、虚拟生成列、逻辑复制增强及OAuth认证,显著提升性能与安全。PolarDB-PG 18 支持存算分离架构,融合海量弹性存储与极致计算性能,搭配丰富插件生态,为企业提供高效、稳定、灵活的云数据库解决方案,助力企业数字化转型如虎添翼!
|
15天前
|
弹性计算 关系型数据库 微服务
基于 Docker 与 Kubernetes(K3s)的微服务:阿里云生产环境扩容实践
在微服务架构中,如何实现“稳定扩容”与“成本可控”是企业面临的核心挑战。本文结合 Python FastAPI 微服务实战,详解如何基于阿里云基础设施,利用 Docker 封装服务、K3s 实现容器编排,构建生产级微服务架构。内容涵盖容器构建、集群部署、自动扩缩容、可观测性等关键环节,适配阿里云资源特性与服务生态,助力企业打造低成本、高可靠、易扩展的微服务解决方案。
1309 5
|
1天前
|
监控 JavaScript Java
基于大模型技术的反欺诈知识问答系统
随着互联网与金融科技发展,网络欺诈频发,构建高效反欺诈平台成为迫切需求。本文基于Java、Vue.js、Spring Boot与MySQL技术,设计实现集欺诈识别、宣传教育、用户互动于一体的反欺诈系统,提升公众防范意识,助力企业合规与用户权益保护。
|
14天前
|
机器学习/深度学习 人工智能 前端开发
通义DeepResearch全面开源!同步分享可落地的高阶Agent构建方法论
通义研究团队开源发布通义 DeepResearch —— 首个在性能上可与 OpenAI DeepResearch 相媲美、并在多项权威基准测试中取得领先表现的全开源 Web Agent。
1343 87
|
1天前
|
JavaScript Java 大数据
基于JavaWeb的销售管理系统设计系统
本系统基于Java、MySQL、Spring Boot与Vue.js技术,构建高效、可扩展的销售管理平台,实现客户、订单、数据可视化等全流程自动化管理,提升企业运营效率与决策能力。
|
3天前
|
弹性计算 安全 数据安全/隐私保护
2025年阿里云域名备案流程(新手图文详细流程)
本文图文详解阿里云账号注册、服务器租赁、域名购买及备案全流程,涵盖企业实名认证、信息模板创建、域名备案提交与管局审核等关键步骤,助您快速完成网站上线前的准备工作。
189 82
2025年阿里云域名备案流程(新手图文详细流程)