DataFrame(10):DataFrame运算——累计统计函数

简介: DataFrame(10):DataFrame运算——累计统计函数

1、相关函数说明

image.png


2、原始数据

df = pd.DataFrame({"id":["00{}".format(i) for i in range(1,10)],
                   "score":[2,3,4,4,5,6,7,7,8]})
display(df)


结果如下:

image.png


3、cumsum()函数:求前n个元素的累积值(很重要的一个函数)

df = pd.DataFrame({"id":["00{}".format(i) for i in range(1,10)],
                   "score":[2,3,4,4,5,6,7,7,8]})
display(df)
df["cumsum"] = df["score"].cumsum(axis=0)
display(df)


结果如下:

image.png


1)cumsum():分组求累计值

df = pd.DataFrame({"id":["001","001","002","003","001","002","002","003","003"],
                   "score":[2,3,4,4,5,6,7,7,8]})
display(df)
df["分组求累计值"] = df.groupby("id").cumsum()
df = df.sort_values(by=["id"])
display(df)

结果如下:

image.png


4、cummax()函数:求前n个元素中的最大值

df = pd.DataFrame({"score":[1,2,1,5,2,6,3,7,1]})
display(df)
df["前n个值中最大值"] = df["score"].cummax(axis=0)
display(df)


结果如下:

image.png


1)cummax()函数:分组求前n个元素中的最大值

df = pd.DataFrame({"id":["001","001","002","003","001","002","002","003","003"],
                   "date":["2020-01-01","2020-01-09","2020-01-05","2020-01-03",
                           "2020-01-08","2020-01-07","2020-01-02","2020-01-04","2020-01-06"],
                   "score":[1,2,1,5,2,6,3,7,1]})
display(df)
df = df.sort_values(by=["id","date"],ascending=[True,True])
df["前n个值中最大值"] = df.groupby("id")["score"].cummax()
display(df)


结果如下:

image.png

注意:cummin()函数的用法和cummax()函数的用法一致,可以自行下去尝试。

 


5、cumprod()函数:求前n个元素的累乘积

df = pd.DataFrame({"score":[1,2,1,5,2,6,3,7,1]})
display(df)
df["前n个值的累乘积"] = df["score"].cummax(axis=0)
display(df)


结果如下:

image.png

注意:对于分组求前n个元素的累乘积,和上面用法一致。


相关文章
|
6月前
|
存储 Python
使用Pandas库对非数值型数据进行排序和排名
在Pandas中,支持对非数值型数据排序和排名。可按以下方法操作:1) 字符串排序,使用`sort_values()`,如`sorted_df = df.sort_values(by='Name', ascending=False)`进行降序排序;2) 日期排序,先用`to_datetime()`转换,再排序,如`sorted_df = df.sort_values(by='Date')`;3) 自定义排序,结合`argsort()`和自定义规则。
79 2
DataFrame(8):DataFrame运算——逻辑运算(用于筛选数据)(二)
DataFrame(8):DataFrame运算——逻辑运算(用于筛选数据)(二)
DataFrame(8):DataFrame运算——逻辑运算(用于筛选数据)(二)
DataFrame(13):DataFrame的排序与排名问题(一)
DataFrame(13):DataFrame的排序与排名问题(一)
DataFrame(13):DataFrame的排序与排名问题(一)
|
2月前
|
数据处理 Python
Pandas快速统计重复值的2种方法
Pandas快速统计重复值的2种方法
105 1
|
3月前
|
Python
掌握pandas中的时序数据分组运算
掌握pandas中的时序数据分组运算
|
6月前
|
人工智能 程序员 数据处理
Pandas数据处理4、DataFrame记录重复值出现的次数(是总数不是每个值的数量)
Pandas数据处理4、DataFrame记录重复值出现的次数(是总数不是每个值的数量)
101 0
Pandas数据处理4、DataFrame记录重复值出现的次数(是总数不是每个值的数量)
DataFrame(8):DataFrame运算——逻辑运算(用于筛选数据)(一)
DataFrame(8):DataFrame运算——逻辑运算(用于筛选数据)(一)
DataFrame(8):DataFrame运算——逻辑运算(用于筛选数据)(一)
Pandas groupby分组后求各组行数
Pandas groupby分组后求各组行数
Pandas groupby分组后求各组行数
|
数据挖掘 Python
Pandas 描述和汇总统计函数
Pandas 描述和汇总统计函数
Pandas 描述和汇总统计函数
Pandas 按照两列分组后只选排序第一名
Pandas 按照两列分组后只选排序第一名