DataFrame(14)：对比MySQL学习“Pandas的groupby分组聚合”(超详细)（五）-阿里云开发者社区

DataFrame(14)：对比MySQL学习“Pandas的groupby分组聚合”(超详细)（五）

2022-06-08 440

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： DataFrame(14)：对比MySQL学习“Pandas的groupby分组聚合”(超详细)（五）

2）直接针对分组对象，调用agg()函数(很重要)

下面知识的讲解，涉及到“聚合函数字符串”，这是我自己起的名字，类似于"sum"、“mean”、“count”、“max”、“min”，都叫做“聚合函数字符串”。同时还需要注意一点，agg（)函数中还有一个axis参数，用于指定行、列。

df.agg(“mean”)

df.agg([“mean”, “sum”, “max”])

df.agg({“利润”:[“mean”, “sum”] , “年龄”:[“max”, “min”]})

df.agg(lambda x: x.mean())

① 传入单个聚合函数字符串

df = pd.DataFrame({"部门":["A", "A", "B", "B"],
                   "利润":[10, 20, 15, 28], 
                   "年龄":[20, 15, 18, 30]})
display(df)
df1 = df.groupby("部门").agg("mean")
display(df1)

结果如下：

② 传入多个聚合函数字符串

df = pd.DataFrame({"部门":["A", "A", "B", "B"],
                   "利润":[10, 20, 15, 28], 
                   "年龄":[20, 15, 18, 30]})
display(df)
df1 = df.groupby("部门").agg(["sum","mean"])
display(df1)

结果如下：

③ 传入一个字典：可以针对不同的列，提供不同的聚合信息。

df = pd.DataFrame({"部门":["A", "A", "B", "B"],
                   "利润":[10, 20, 15, 28], 
                   "年龄":[20, 15, 18, 30]})
display(df)
df1 = df.groupby("部门").agg({"利润":["sum","mean"],"年龄":["max","min"]})
display(df1)

结果如下：

④ 传入自定义函数

df = pd.DataFrame({"部门":["A", "A", "A", "B", "B", "B"],
                   "利润":[10, 32, 20, 15, 28, 10], 
                   "销售量":[20, 15, 33, 18, 30, 22]})
display(df)
df.groupby("部门").agg(lambda x:x.max()-x.min())

结果如下：

DataFrame(14)：对比MySQL学习“Pandas的groupby分组聚合”(超详细)（五）

2）直接针对分组对象，调用agg()函数(很重要)

热门文章

最新文章

相关课程

相关电子书

推荐镜像

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

DataFrame(14)：对比MySQL学习“Pandas的groupby分组聚合”(超详细)（五）

2）直接针对分组对象，调用agg()函数(很重要)

热门文章

最新文章

相关课程

相关电子书

推荐镜像