盘点一道Pandas中分组聚合groupby()函数用法的基础题

简介: 盘点一道Pandas中分组聚合groupby()函数用法的基础题

昨天忘记标注原创了,今天继续重新发布一下!勿怪勿怪!


大家好,我是皮皮。


一、前言


前几天在Python最强王者交流群有个叫【Chloé】的粉丝问了一个关于Pandas中groupby函数的问题,这里拿出来给大家分享下,一起学习。

8f561f52a43c90d29906a78aef7ef33.jpg

这个粉丝在法国留学,所以提问是英文的,当然了英文看上去也不难,有点二级英文基础,也看得懂,实在不行,在线翻译一下也问题不大了。


二、解决过程


这里给出【dcpeng】大佬和【月神】的解答。

【dcpeng】的解答

gruopby是分组的意思,这个我们都知道。python中groupby函数主要的作用是进行数据的分组以及分组后的组内运算!

对于数据的分组和分组运算主要是指groupby函数的应用,具体函数的规则如下:

df.groupby([df[属性],df[属性])(指分类的属性,数据的限定定语,可以有多个).mean()(对于数据的计算方式——函数名称)

70f82f5fefd0e50ab40ee155116286f.jpg

如上图所示,前面是没问题的,后面有个地方他的解析有点问题,好在有【月神】补充,一起来看看吧!

【月神】的解答

405682da1521e5e9347e3bff7cbd0d8f.png

从这个图里可以看出来使用driver_gender列对data进行聚合后再对search_conducted列进行分组求和。.sum()就是求和函数,对指定数据列进行相加。

5da785a641fa8e6496a095e5086252b.jpg

上面【dcpeng】大佬认为这个search_conducted是个函数,其实不是,它是指分类的属性,数据的限定,search_conducted是具体的列,需要结合数据查看。其实说白了,就只是针对分组后的search_conducted列进行sum求和。


【月神】在这里还多了一些拓展,详情如下图所示。


此图一出,小伙伴们直呼好家伙,确实太清晰了,一目了然!

e8ed369fe9a90e189f6d6681c4734d5.jpg


三、总结


大家好,我是Python进阶者。这篇文章基于粉丝提问,针对Pandas中分组聚合groupby()函数用法的基础题问题,给出了具体说明和演示,顺利地帮助粉丝解决了问题。


总的来说,python中groupby函数主要的作用是进行数据的分组以及分组后的组内运算!对于数据的分组和分组运算主要是指groupby函数的应用,具体函数的规则如下:

df.groupby([df[属性],df[属性])(指分类的属性,数据的限定定语,可以有多个).mean()(对于数据的计算方式——函数名称)


最后感谢粉丝【Chloé】提问,感谢【月神】和【dcpeng】大佬给出的示例和代码支持,感谢粉丝【冫马讠成】、【Zhang Zhiyu】、【PI】、【东哥】、【艾希·觉罗】、【༺ཉི།།与歌同行ཉྀ༻】、【Toria D.】、【༺⃰ཊ⃰-听风-ཏ⃰༻⃰】等人参与学习交流。


小伙伴们,快快用实践一下吧!如果在学习过程中,有遇到任何问题,欢迎加我好友,我拉你进Python学习交流群共同探讨学习。


相关文章
|
23天前
|
Python
|
22天前
|
Python
Pandas 常用函数-数据合并
Pandas 常用函数-数据合并
34 1
|
23天前
|
索引 Python
Pandas 常用函数-数据排序
10月更文挑战第28天
10 1
|
22天前
|
BI Python
Pandas 常用函数-数据统计和描述
Pandas 常用函数-数据统计和描述
68 0
|
22天前
|
Python
Pandas 常用函数-数据选择和过滤
Pandas 常用函数-数据选择和过滤
11 0
|
28天前
|
数据采集 存储 数据挖掘
Python数据分析:Pandas库的高效数据处理技巧
【10月更文挑战第27天】在数据分析领域,Python的Pandas库因其强大的数据处理能力而备受青睐。本文介绍了Pandas在数据导入、清洗、转换、聚合、时间序列分析和数据合并等方面的高效技巧,帮助数据分析师快速处理复杂数据集,提高工作效率。
62 0
|
3月前
|
机器学习/深度学习 数据处理 Python
从NumPy到Pandas:轻松转换Python数值库与数据处理利器
从NumPy到Pandas:轻松转换Python数值库与数据处理利器
82 0
|
29天前
|
存储 数据挖掘 数据处理
Python数据分析:Pandas库的高效数据处理技巧
【10月更文挑战第26天】Python 是数据分析领域的热门语言,Pandas 库以其高效的数据处理功能成为数据科学家的利器。本文介绍 Pandas 在数据读取、筛选、分组、转换和合并等方面的高效技巧,并通过示例代码展示其实际应用。
36 2
|
2月前
|
机器学习/深度学习 并行计算 大数据
【Python篇】深入挖掘 Pandas:机器学习数据处理的高级技巧
【Python篇】深入挖掘 Pandas:机器学习数据处理的高级技巧
88 3
|
2月前
|
数据采集 数据挖掘 API
Python数据分析加速器:深度挖掘Pandas与NumPy的高级功能
在Python数据分析的世界里,Pandas和NumPy无疑是两颗璀璨的明星,它们为数据科学家和工程师提供了强大而灵活的工具集,用于处理、分析和探索数据。今天,我们将一起深入探索这两个库的高级功能,看看它们如何成为数据分析的加速器。
43 1