技巧 | 分享几个Pandas高效函数(一)

简介: 技巧 | 分享几个Pandas高效函数(一)

大家好,我是欧K~

本期给大家推荐几个pandas高效数据处理函数(持续更新),希望对你有所帮助:


1. 字典创建Dataframe

2. 列拆分(split/extract)

3. 列合并(cat)

4. 左右填充(pad)

5. 根据类型筛选列(select_dtypes)

6. 排序(rank)


1. 字典创建Dataframe

df_dict = {'name':['Alice_001','Bob_002','Cindy_003','Eric_004','Helen_005','Grace_006'],'sex':['female','male','female','male','female','male'],'math':[90,89,99,78,97,93],'english':[95,94,80,94,94,90]}
#[1].直接写入参数test_dict
df = pd.DataFrame(df_dict)
#[2].字典型赋值
df = pd.DataFrame(data=df_dict)




2. 列拆分(split/extract)

字符拆分:

df1[['name', 'id']] = df1['name'].str.split('_', 2, expand = True)



正则表达式拆分:

df2 = df.copy()
df2['name2'] = df2['name'].str.extract('([A-Z]+[a-z]+)')
df2['id2'] = df2['name'].str.extract('(\d+)')



3. 列合并(cat)

自定义连接符:

df1["name_id"] = df1["name"].str.cat(df1["id"],sep='_'*3)


某列合并输出:

df1["name"].str.cat(sep='*'*5)



4. 左右填充(pad)

左填充:

df1["id"] = df1["id"].str.pad(10,fillchar="*")
# 相当于ljust()
df1["id"] = df1["id"].str.rjust(10,fillchar="*")


右填充:

df1["id"] = df1["id"].str.pad(10,side="right",fillchar="*")


两侧填充

df1["id"] = df1["id"].str.pad(10,side="both",fillchar="*")



5. 根据类型筛选列(select_dtypes)

筛选数值列:

df1.select_dtypes(include=['float64', 'int64'])


筛选object列:

df1.select_dtypes(include=['object'])


6. 排序(rank)

英语成绩排名:

df1['e_rank'] = df1['english'].rank(method='min',ascending=False)


94分有三个,所以三个并列第2

END


以上就是本期为大家整理的全部内容了,赶快练习起来吧,喜欢的朋友可以点赞、点在看也可以分享让更多人知道

相关文章
|
11天前
|
存储 数据挖掘 数据处理
Pandas中explode()函数的应用与实战
Pandas中explode()函数的应用与实战
16 0
|
11天前
|
数据挖掘 数据处理 索引
python常用pandas函数nlargest / nsmallest及其手动实现
python常用pandas函数nlargest / nsmallest及其手动实现
39 0
|
11天前
|
人工智能 数据处理 计算机视觉
Pandas数据处理——渐进式学习、DataFrame(函数检索-请使用Ctrl+F搜索)
Pandas数据处理——渐进式学习、DataFrame(函数检索-请使用Ctrl+F搜索)
80 0
|
11天前
|
数据处理 索引 Python
使用pandas的merge()和join()函数进行数据处理
使用pandas的merge()和join()函数进行数据处理
35 2
|
11天前
|
机器学习/深度学习 存储 算法
Pandas中的get_dummies()函数实战应用详解
Pandas中的get_dummies()函数实战应用详解
14 1
|
11天前
|
NoSQL Serverless Python
在Python的Pandas中,可以通过直接赋值或使用apply函数在DataFrame添加新列。
【5月更文挑战第2天】在Python的Pandas中,可以通过直接赋值或使用apply函数在DataFrame添加新列。方法一是直接赋值,如`df['C'] = 0`,创建新列C并初始化为0。方法二是应用函数,例如定义`add_column`函数计算A列和B列之和,然后使用`df.apply(add_column, axis=1)`,使C列存储每行A、B列的和。
56 0
|
11天前
|
人工智能 数据挖掘 Python
Python pandas中read_csv函数的io参数
Python pandas中read_csv函数的io参数
27 5
|
11天前
|
数据处理 数据格式 Python
python进行数据处理——pandas的drop函数
python进行数据处理——pandas的drop函数
|
11天前
|
Python
在Python中,pandas库的`get_dummies`函数
在Python中,pandas库的`get_dummies`函数
138 2
|
11天前
|
人工智能 程序员 数据处理
Pandas数据处理3、DataFrame去重函数drop_duplicates()详解
Pandas数据处理3、DataFrame去重函数drop_duplicates()详解
84 0
Pandas数据处理3、DataFrame去重函数drop_duplicates()详解