数据分析工具Pandas（6）：Pandas统计计算和描述-阿里云开发者社区

数据分析工具Pandas（6）：Pandas统计计算和描述

2021-12-09 135

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： 数据分析工具Pandas（6）：Pandas统计计算和描述

数据分析工具Pandas（1）：Pandas的数据结构

数据分析工具Pandas（2）：Pandas的索引操作

数据分析工具Pandas（3）：Pandas的对齐运算

数据分析工具Pandas（4）：Pandas的函数应用

数据分析工具Pandas（5）：Pandas的层级索引

数据分析工具Pandas（6）：Pandas统计计算和描述

Pandas统计计算和描述

import numpy as np
import pandas as pd
df_obj = pd.DataFrame(np.random.randn(5,4), columns = ['a', 'b', 'c', 'd'])
print(df_obj)

运行结果：

          a         b         c         d
0  1.469682  1.948965  1.373124 -0.564129
1 -1.466670 -0.494591  0.467787 -2.007771
2  1.368750  0.532142  0.487862 -1.130825
3 -0.758540 -0.479684  1.239135  1.073077
4 -0.007470  0.997034  2.669219  0.742070          a         b         c         d
0  1.469682  1.948965  1.373124 -0.564129
1 -1.466670 -0.494591  0.467787 -2.007771
2  1.368750  0.532142  0.487862 -1.130825
3 -0.758540 -0.479684  1.239135  1.073077
4 -0.007470  0.997034  2.669219  0.742070

常用的统计计算

sum, mean, max, min…

axis=0 按列统计，axis=1按行统计

skipna 排除缺失值，默认为True

df_obj.sum()
df_obj.max()
df_obj.min(axis=1, skipna=False)

运行结果：

a    0.605751
b    2.503866
c    6.237127
d   -1.887578
dtype: float64
a    1.469682
b    1.948965
c    2.669219
d    1.073077
dtype: float64
0   -0.564129
1   -2.007771
2   -1.130825
3   -0.758540
4   -0.007470
dtype: float64a    0.605751
b    2.503866
c    6.237127
d   -1.887578
dtype: float64
a    1.469682
b    1.948965
c    2.669219
d    1.073077
dtype: float64
0   -0.564129
1   -2.007771
2   -1.130825
3   -0.758540
4   -0.007470
dtype: float64

常用的统计描述

describe 产生多个统计数据

print(df_obj.describe())

运行结果：

              a         b         c         d
count  5.000000  5.000000  5.000000  5.000000
mean   0.180305  0.106488  0.244978  0.178046
std    0.641945  0.454340  1.064356  1.144416
min   -0.677175 -0.490278 -1.164928 -1.574556
25%   -0.064069 -0.182920 -0.464013 -0.089962
50%    0.231722  0.127846  0.355859  0.190482
75%    0.318854  0.463377  1.169750  0.983663
max    1.092195  0.614413  1.328220  1.380601              a         b         c         d
count  5.000000  5.000000  5.000000  5.000000
mean   0.180305  0.106488  0.244978  0.178046
std    0.641945  0.454340  1.064356  1.144416
min   -0.677175 -0.490278 -1.164928 -1.574556
25%   -0.064069 -0.182920 -0.464013 -0.089962
50%    0.231722  0.127846  0.355859  0.190482
75%    0.318854  0.463377  1.169750  0.983663
max    1.092195  0.614413  1.328220  1.380601

数据分析工具Pandas（6）：Pandas统计计算和描述

常用的统计计算

常用的统计描述

常用的统计描述方法：

热门文章

最新文章

相关课程

相关电子书

相关实验场景

热门

活动广场

任务中心

开发者评测

高校计划

乘风者计划

训练营

阿里云MVP

话题

直播

下载

镜像站

技术资料

插件

数据分析工具Pandas（6）：Pandas统计计算和描述

常用的统计计算

常用的统计描述

常用的统计描述方法：

热门文章

最新文章

相关课程

相关电子书

相关实验场景