昨天忘记标注原创了,今天继续重新发布一下!勿怪勿怪!
大家好,我是皮皮。
一、前言
前几天在Python最强王者交流群有个叫【Chloé】的粉丝问了一个关于Pandas中groupby函数的问题,这里拿出来给大家分享下,一起学习。
这个粉丝在法国留学,所以提问是英文的,当然了英文看上去也不难,有点二级英文基础,也看得懂,实在不行,在线翻译一下也问题不大了。
二、解决过程
这里给出【dcpeng】大佬和【月神】的解答。
【dcpeng】的解答
gruopby是分组的意思,这个我们都知道。python中groupby函数主要的作用是进行数据的分组以及分组后的组内运算!
对于数据的分组和分组运算主要是指groupby函数的应用,具体函数的规则如下:
df.groupby([df[属性],df[属性])(指分类的属性,数据的限定定语,可以有多个).mean()(对于数据的计算方式——函数名称)
如上图所示,前面是没问题的,后面有个地方他的解析有点问题,好在有【月神】补充,一起来看看吧!
【月神】的解答
从这个图里可以看出来使用driver_gender
列对data进行聚合后再对search_conducted
列进行分组求和。.sum()就是求和函数,对指定数据列进行相加。
上面【dcpeng】大佬认为这个search_conducted
是个函数,其实不是,它是指分类的属性,数据的限定,search_conducted
是具体的列,需要结合数据查看。其实说白了,就只是针对分组后的search_conducted列进行sum求和。
【月神】在这里还多了一些拓展,详情如下图所示。
此图一出,小伙伴们直呼好家伙,确实太清晰了,一目了然!
三、总结
大家好,我是Python进阶者。这篇文章基于粉丝提问,针对Pandas中分组聚合groupby()函数用法的基础题问题,给出了具体说明和演示,顺利地帮助粉丝解决了问题。
总的来说,python中groupby函数主要的作用是进行数据的分组以及分组后的组内运算!对于数据的分组和分组运算主要是指groupby函数的应用,具体函数的规则如下:
df.groupby([df[属性],df[属性])(指分类的属性,数据的限定定语,可以有多个).mean()(对于数据的计算方式——函数名称)
最后感谢粉丝【Chloé】提问,感谢【月神】和【dcpeng】大佬给出的示例和代码支持,感谢粉丝【冫马讠成】、【Zhang Zhiyu】、【PI】、【东哥】、【艾希·觉罗】、【༺ཉི།།与歌同行ཉྀ༻】、【Toria D.】、【༺⃰ཊ⃰-听风-ཏ⃰༻⃰】等人参与学习交流。
小伙伴们,快快用实践一下吧!如果在学习过程中,有遇到任何问题,欢迎加我好友,我拉你进Python学习交流群共同探讨学习。