groupby 操作|学习笔记

简介: 快速学习 groupby 操作

开发者学堂课程【Python 常用数据科学库:groupby 操作】学习笔记,与课程紧密联系,让用户快速学习知识

课程地址https://developer.aliyun.com/learning/course/546/detail/7480


groupby 操作


1.定义:

在使用 python 进行数据分析的过程中,采用 groupby 函数对数据进行分组是一项很常用的操作,它可以帮助我们更清晰地了解我们所用数据的组成及规律,本节将为大家简单介绍一下如果使用 groupby 函数对数据进行分组的具体做法。

In [1]: import pandas as pd

df = pd.DataFrame({'key':['A','B','C','A','B','C','A','B','C'],

'data': [0, 5, 10, 5, 10, 15, 10, 15, 20]})

Df

image.png

//key 相当于一个标签,'A','B','C'相当于三个品牌,把 key 传进去,看看对应当前key 是不是一样的,之后把 key 回传到索引中,最后求出 sum 和。由此可以看出ABC 的累加和,是45.

In [2]: for key in ['A','B','C']:

print (key,df [df['key'] == key].sum())

image.png

image.png

先写一个函数,split 将前面的分成三块A B C ,然后 apply 进行分组算和,最后加在一起。

//用 groupby 的方法,快速简单得到和。这样在数据上做一些数据统计就比较方便,还可以指定 numpy 的操作,那样就不是 sum,而是 aggregate。总值平均值都可以求。

In [3]: df.groupby('key').sum()

image.png

In [5]:import numpy as np

df. groupby('key').aggregate (np. sum)

image.png

In [6]:import numpy as np

df.groupby('key').aggregate (np.mean)

image.png

In [7]: df = pd.read_csv(‘./data/titanic.csv')

In [8]: df. groupby ('Sex') ['Age'].mean()

image.png

//查看男性和女性的年龄

In [10]: df. groupby('Sex') ['Survived']. mean()

//统计男性女性的获救概率

//执行这样的操作非常方便,就是用格外统计数据来说,可以统计数据当中,很多个指标进行分析。

2.操作步骤:

(1)、分缩,(2)、打开,(3)、结合

相关文章
|
机器学习/深度学习 索引 Python
技术经验分享:DataFrame(1):结构介绍
技术经验分享:DataFrame(1):结构介绍
568 0
|
6天前
|
弹性计算 人工智能 安全
云上十五年——「弹性计算十五周年」系列客户故事(第二期)
阿里云弹性计算十五年深耕,以第九代ECS g9i实例引领算力革新。携手海尔三翼鸟、小鹏汽车、微帧科技等企业,实现性能跃升与成本优化,赋能AI、物联网、智能驾驶等前沿场景,共绘云端增长新图景。
|
12天前
|
存储 弹性计算 人工智能
【2025云栖精华内容】 打造持续领先,全球覆盖的澎湃算力底座——通用计算产品发布与行业实践专场回顾
2025年9月24日,阿里云弹性计算团队多位产品、技术专家及服务器团队技术专家共同在【2025云栖大会】现场带来了《通用计算产品发布与行业实践》的专场论坛,本论坛聚焦弹性计算多款通用算力产品发布。同时,ECS云服务器安全能力、资源售卖模式、计算AI助手等用户体验关键环节也宣布升级,让用云更简单、更智能。海尔三翼鸟云服务负责人刘建锋先生作为特邀嘉宾,莅临现场分享了关于阿里云ECS g9i推动AIoT平台的场景落地实践。
【2025云栖精华内容】 打造持续领先,全球覆盖的澎湃算力底座——通用计算产品发布与行业实践专场回顾
|
4天前
|
云安全 人工智能 安全
Dify平台集成阿里云AI安全护栏,构建AI Runtime安全防线
阿里云 AI 安全护栏加入Dify平台,打造可信赖的 AI
|
11天前
|
人工智能 自然语言处理 自动驾驶
关于举办首届全国大学生“启真问智”人工智能模型&智能体大赛决赛的通知
关于举办首届全国大学生“启真问智”人工智能模型&智能体大赛决赛的通知
|
7天前
|
人工智能 运维 Java
Spring AI Alibaba Admin 开源!以数据为中心的 Agent 开发平台
Spring AI Alibaba Admin 正式发布!一站式实现 Prompt 管理、动态热更新、评测集构建、自动化评估与全链路可观测,助力企业高效构建可信赖的 AI Agent 应用。开源共建,现已上线!
682 17
|
6天前
|
人工智能 Java Nacos
基于 Spring AI Alibaba + Nacos 的分布式 Multi-Agent 构建指南
本文将针对 Spring AI Alibaba + Nacos 的分布式多智能体构建方案展开介绍,同时结合 Demo 说明快速开发方法与实际效果。
428 34