技巧 | 分享几个Pandas高效函数(二)

简介: 技巧 | 分享几个Pandas高效函数(二)

大家好,我是欧K~

本期再给大家推荐几个pandas高效数据处理函数(持续更新),希望对你有所帮助:目录

1. 一行数据展开成多行(explode)

2. 多行数据合并成一行

3. 列依次的累加(cumsum)

4. 分组统计生成新的Dataframe

5. 指定位置插入列(insert)

6. 列条件替换(where)

示例数据:

df2 = pd.DataFrame({'id':['a','b','a','c'], 'data_1':[3,7,[1,4,5],9], 'data_2':[1,1,1,1]})




1. 将一行数据展开成多行(explode)

列表展开:

df2.explode('data_1').reset_index(drop=True)



2. 多行数据合并成一行

按id合并:

df2.groupby(['id']).agg({'data_1': [', '.join],'data_1': lambda x: list(x)}).reset_index()



3. 列依次的累加(cumsum)

类似打卡记录:

df2['data_cumsum'] = df2[['data_2','id']].groupby('id').cumsum()


4. 分组统计生成新的Dataframe

按id分组:

df2.groupby('id')['data_2'].count().to_frame('数量').reset_index()



5. 指定位置插入列(insert)

在第三列位置插入新列(从0开始计算):

new_col = np.random.randint(1,10,size=6)
df2.insert(1, 'data_0', new_col)



6. 列条件替换(where)

指定列小于5的值替换成0:

df2['data_1'] = df2['data_1'].where(df2['data_1'] > 5 , 0)


END


以上就是本期为大家整理的全部内容了,赶快练习起来吧,喜欢的朋友可以点赞、点在看也可以分享让更多人知道


相关文章
|
8天前
|
存储 数据挖掘 数据处理
Pandas中explode()函数的应用与实战
Pandas中explode()函数的应用与实战
12 0
|
8天前
|
数据挖掘 数据处理 索引
python常用pandas函数nlargest / nsmallest及其手动实现
python常用pandas函数nlargest / nsmallest及其手动实现
36 0
|
8天前
|
人工智能 数据处理 计算机视觉
Pandas数据处理——渐进式学习、DataFrame(函数检索-请使用Ctrl+F搜索)
Pandas数据处理——渐进式学习、DataFrame(函数检索-请使用Ctrl+F搜索)
80 0
|
8天前
|
数据处理 索引 Python
使用pandas的merge()和join()函数进行数据处理
使用pandas的merge()和join()函数进行数据处理
30 2
|
8天前
|
机器学习/深度学习 存储 算法
Pandas中的get_dummies()函数实战应用详解
Pandas中的get_dummies()函数实战应用详解
13 1
|
8天前
|
NoSQL Serverless Python
在Python的Pandas中,可以通过直接赋值或使用apply函数在DataFrame添加新列。
【5月更文挑战第2天】在Python的Pandas中,可以通过直接赋值或使用apply函数在DataFrame添加新列。方法一是直接赋值,如`df['C'] = 0`,创建新列C并初始化为0。方法二是应用函数,例如定义`add_column`函数计算A列和B列之和,然后使用`df.apply(add_column, axis=1)`,使C列存储每行A、B列的和。
50 0
|
8天前
|
人工智能 数据挖掘 Python
Python pandas中read_csv函数的io参数
Python pandas中read_csv函数的io参数
27 5
|
8天前
|
数据处理 数据格式 Python
python进行数据处理——pandas的drop函数
python进行数据处理——pandas的drop函数
|
8天前
|
Python
在Python中,pandas库的`get_dummies`函数
在Python中,pandas库的`get_dummies`函数
131 2
|
8天前
|
人工智能 程序员 数据处理
Pandas数据处理3、DataFrame去重函数drop_duplicates()详解
Pandas数据处理3、DataFrame去重函数drop_duplicates()详解
79 0
Pandas数据处理3、DataFrame去重函数drop_duplicates()详解