Pandas之七分组统计-阿里云开发者社区

开发者社区> 开发与运维> 正文
登录阅读全文

Pandas之七分组统计

简介: Pandas中提供了groupy方法对数据进行分组

在数据分析时,分组也是一个常用的功能,比如分别统计每个月的股票波动率、每个部门的人数、每个季度的利润等等。在Pandas中提供了groupy方法对数据进行分组。Pandas中的groupby一般包括以下三个步骤:

  1. 拆分,依据指定的规则将数据拆分为不同的组合。
  2. 执行函数,将一个方法相对独立地在每个组合上执行。
  3. 组合,将每个组合上执行的结果组合到一个结果集中。

下面我们以图中的数据来演示上述各项功能。

1、分组

使用groupby方法,将df3进行分组,并使用list查看分组的内容。

g1 = df3.groupby("E")
g1
list(g1)

可以看到,分组实际上是将指定分组的列不同值作为key(默认忽略np.nan,可以使用dropna=False配置修改),再将dataframe中相应的数据拆分出来作为其value

2、求和示例

分组后的对象,可以使用多种内置聚合函数,比如求和sum、平均值mean、标准差std等。本例对分组后的对象g1进行求和,计算根据E列分组后,其他各列求和的结果。

也可以计算指定列的求和结果,比如只计算A列的和。

版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。

分享:
开发与运维
使用钉钉扫一扫加入圈子
+ 订阅

集结各类场景实战经验,助你开发运维畅行无忧

其他文章
最新文章
相关文章