对比python字符串函数,学习pandas的str矢量化字符串函数(四)

简介: 对比python字符串函数,学习pandas的str矢量化字符串函数(四)

⑨ repeat:重复字符串几次

df["性别"].str.repeat(3)


结果如下:

image.png


⑩ slice_replace:使用给定的字符串,替换指定的位置的字符

df["电话号码"].str.slice_replace(4,8,"*"*4)


结果如下:

image.png


⑪ replace:将指定位置的字符,替换为给定的字符串

df["身高"].str.replace(":","-")


结果如下:

image.png


⑫ replace:将指定位置的字符,替换为给定的字符串(接受正则表达式)

replace中传入正则表达式,才叫好用;

先不要管下面这个案例有没有用,你只需要知道,使用正则做数据清洗多好用;
df["收入"].str.replace("\d+\.\d+","正则")


结果如下:

image.png


⑬ split方法+expand参数:搭配join方法功能很强大

# 普通用法
df["身高"].str.split(":")
# split方法,搭配expand参数
df[["身高描述","final身高"]] = df["身高"].str.split(":",expand=True)
df
# split方法搭配join方法
df["身高"].str.split(":").str.join("?"*5)


结果如下:


image.png

⑭ strip/rstrip/lstrip:去除空白符、换行符

df["姓名"].str.len()
df["姓名"] = df["姓名"].str.strip()
df["姓名"].str.len()


结果如下:

image.png


⑮ findall:利用正则表达式,去字符串中匹配,返回查找结果的列表

findall使用正则表达式,做数据清洗,真的很香!
df["身高"]
df["身高"].str.findall("[a-zA-Z]+")


结果如下:

image.png


⑯ extract/extractall:接受正则表达式,抽取匹配的字符串(一定要加上括号)

d

f["身高"].str.extract("([a-zA-Z]+)")
# extractall提取得到复合索引
df["身高"].str.extractall("([a-zA-Z]+)")
# extract搭配expand参数
df["身高"].str.extract("([a-zA-Z]+).*?([a-zA-Z]+)",expand=True)


结果如下:

image.png

相关文章
|
3天前
|
索引 Python
Python中的字符串格式化:详解与应用
Python中的字符串格式化:详解与应用
10 0
|
3天前
|
Python
Python小技巧:一种字符串的排序方式
该文介绍了如何对包含数字的字符串列表进行特定排序。首先,示例了一个初始问题,使用Python内置的`sorted()`函数未能达到预期(按数字部分升序排序)。然后,文章提出通过自定义排序键`sort_key`来解决,利用正则表达式提取字符串尾部数字并进行排序。进一步,文章扩展到处理如'nxxx_name_nxxx'格式的字符串,通过给前缀和后缀数字赋予不同权重进行复合排序,展示了如何实现先按前缀、再按后缀排序的功能。提供的代码示例成功地完成了任务。
|
2天前
|
索引 Python
Python字符串的定义与操作详解
Python字符串的定义与操作详解
6 1
|
3天前
|
IDE 开发工具 开发者
Python函数说明文档:编写清晰易懂的文档字符串
Python函数说明文档:编写清晰易懂的文档字符串
7 1
|
3天前
|
机器学习/深度学习 移动开发 知识图谱
|
4天前
|
存储 索引 Python
 Python字符串
 Python字符串
14 0
|
5天前
|
数据采集 SQL 数据处理
Python中的Pandas库:数据处理与分析的利器
Python中的Pandas库:数据处理与分析的利器
17 0
|
5天前
|
Python
Python字符串格式化
Python字符串格式化
13 0
|
6天前
|
数据采集 数据挖掘 数据处理
Python数据分析实战:使用Pandas处理Excel文件
Python数据分析实战:使用Pandas处理Excel文件
76 0
|
6天前
|
数据采集 数据可视化 数据处理
Python中的高效数据处理:Pandas库详解
Python中的高效数据处理:Pandas库详解
27 2