Python正则表达式相关函数(学习笔记)

简介: Python正则表达式相关函数(学习笔记)

(1) re.match



match(pat,str) 从开始位置开始匹配,如果开头没有则无

import re
def look_for(p,s):
        return '没有找到' if re.search(p,s) is None else re.findall(p,s)
str="""
5
072003210 一一
1234567890男02/28/2022
6
072003210 二二
1034567890女01/23/2021
7
072003210 三三
1234167890男03/27/2020
"""
str

运行结果 str的内容:⬇

'\n5\n072003210 一一\n1234567890男02/28/2022\n6\n072003210 二二\n1034567890女01/23/2021\n7\n072003210 三三\n1234167890男03/27/2020\n'
print(re.match(r'一一',str))   #匹配不到,因为一一不是在开头
print(re.match(r'\n5',str))

运行结果:

None                        #匹配不到,因为一一不是在开头
<re.Match object; span=(0, 2), match='\n5'>

如果只想拿到要匹配的字符串,则使用group( )

l1='经济与管理T3大数据分析'
print(re.match(r'经济',l1).group())

运行结果:

经济


(2) re.search



search(pat,str) 搜索整个字符串

l1='经济与管理T3大数据分析'
print(re.search(r'经济',l1).group())
print(re.search(r'数据',l1))

运行结果:

经济
<re.Match object; span=(10, 12), match='数据'>


(3) re.findall



findall(pat,str) 搜索整个字符串,返回一个list

l1='经济economy经济金融数据分析数据data'
print(re.findall(r'经济',l1))
print(re.findall(r'数据',l1))

运行结果:

['经济', '经济']
['数据', '数据']


(4) re.finditer



finditer(pat,str) 以迭代器的方式输出,返回所有符合某个模型的字符串

比较一下finditerfindall的区别:

print([i for i in re.finditer(r'经',l1)])
print([i for i in re.findall(r'经',l1)])

运行结果:

[<re.Match object; span=(0, 1), match='经'>, <re.Match object; span=(9, 10), match='经'>]
['经', '经']


(5) re.split



split(pat,str) 以某个模型为分割点,拆分整个字符串为一系列字符串,以列表形式

str="""
5
072003210 一一
1234567890男02/28/2022
6
072003210 二二
1034567890女01/23/2021
7
072003210 三三
1234167890男03/27/2020
"""
l11=re.split(r'\n',str)
type(l11)

运行结果: 此时l11是list类型

list
l11

运行结果:l11的内容👇

['',
 '5',
 '072003210 一一',
 '1234567890男02/28/2022',
 '6',
 '072003210 二二',
 '1034567890女01/23/2021',
 '7',
 '072003210 三三',
 '1234167890男03/27/2020',
 '']


(6) re.sub



sub(pat,str) str中找到匹配某个模型的所有字符串,用其他字符串进行替代

l12=re.sub(r'/','-',l11)  

由于此时l11list类型,因此不能使用sub函数,会报错

d24239a021854360b559c7a06d607f90.png

必须改成数组形式

l12=re.sub(r'/','-',l11[3])  # 把/全部替换成-
l12

运行结果:

'1234567890男02-28-2022'


(7) re.compile



compile(pat) 对某个模型进行编译,以便后期使用

str0="""
'02/28/2022 08:00:00,91,T3大数据分析';
'02/28/2022 09:00:00,90,T3数据库原理与应用';
'02/28/2022 11:00:00,92,T3数据库营销';
"""
pat=r",([0-9]{2}),"
obj=re.compile(pat)
print(obj.match(str0))
print(obj.search(str0))
print(obj.findall(str0))
print([i for i in obj.finditer(str0)])

运行结果:

None
<re.Match object; span=(21, 25), match=',91,'>
['91', '90', '92']
[<re.Match object; span=(21, 25), match=',91,'>, <re.Match object; span=(55, 59), match=',90,'>, <re.Match object; span=(92, 96), match=',92,'>]

总结



正则表达式相关函数:

(1) re.match :从开始位置开始匹配,如果开头没有则无

match(pat,str)

(2) re.search :搜索整个字符串

search(pat,str)

(3) re.findall :搜索整个字符串,返回一个list

findall(pat,str)

(4) re.finditer :以迭代器的方式输出,返回所有符合某个模型的字符串

finditer(pat,str)

(5) re.split :以某个模型为分割点,拆分整个字符串为一系列字符串,以列表形式

split(pat,str)

(6) re.sub :str中找到匹配某个模型的所有字符串,用其他字符串进行替代

sub(pat,str)

(7) re.compile :对某个模型进行编译,以便后期使用

compile(pat)


相关文章
|
29天前
|
Python
【python从入门到精通】-- 第五战:函数大总结
【python从入门到精通】-- 第五战:函数大总结
62 0
|
3天前
|
Python
在Python中,可以使用内置的`re`模块来处理正则表达式
在Python中,可以使用内置的`re`模块来处理正则表达式
10 5
|
26天前
|
Python
Python之函数详解
【10月更文挑战第12天】
Python之函数详解
|
27天前
|
存储 数据安全/隐私保护 索引
|
8天前
|
数据采集 Web App开发 iOS开发
如何使用 Python 语言的正则表达式进行网页数据的爬取?
使用 Python 进行网页数据爬取的步骤包括:1. 安装必要库(requests、re、bs4);2. 发送 HTTP 请求获取网页内容;3. 使用正则表达式提取数据;4. 数据清洗和处理;5. 循环遍历多个页面。通过这些步骤,可以高效地从网页中提取所需信息。
|
1月前
|
网络协议 Java Linux
PyAV学习笔记(一):PyAV简介、安装、基础操作、python获取RTSP(海康)的各种时间戳(rtp、dts、pts)
本文介绍了PyAV库,它是FFmpeg的Python绑定,提供了底层库的全部功能和控制。文章详细讲解了PyAV的安装过程,包括在Windows、Linux和ARM平台上的安装步骤,以及安装中可能遇到的错误和解决方法。此外,还解释了时间戳的概念,包括RTP、NTP、PTS和DTS,并提供了Python代码示例,展示如何获取RTSP流中的各种时间戳。最后,文章还提供了一些附录,包括Python通过NTP同步获取时间的方法和使用PyAV访问网络视频流的技巧。
162 4
PyAV学习笔记(一):PyAV简介、安装、基础操作、python获取RTSP(海康)的各种时间戳(rtp、dts、pts)
|
1月前
|
Python
Socket学习笔记(二):python通过socket实现客户端到服务器端的图片传输
使用Python的socket库实现客户端到服务器端的图片传输,包括客户端和服务器端的代码实现,以及传输结果的展示。
122 3
Socket学习笔记(二):python通过socket实现客户端到服务器端的图片传输
|
1月前
|
JSON 数据格式 Python
Socket学习笔记(一):python通过socket实现客户端到服务器端的文件传输
本文介绍了如何使用Python的socket模块实现客户端到服务器端的文件传输,包括客户端发送文件信息和内容,服务器端接收并保存文件的完整过程。
128 1
Socket学习笔记(一):python通过socket实现客户端到服务器端的文件传输
|
16天前
|
测试技术 数据安全/隐私保护 Python
探索Python中的装饰器:简化和增强你的函数
【10月更文挑战第24天】在Python编程的海洋中,装饰器是那把可以令你的代码更简洁、更强大的魔法棒。它们不仅能够扩展函数的功能,还能保持代码的整洁性。本文将带你深入了解装饰器的概念、实现方式以及如何通过它们来提升你的代码质量。让我们一起揭开装饰器的神秘面纱,学习如何用它们来打造更加优雅和高效的代码。
|
18天前
|
弹性计算 安全 数据处理
Python高手秘籍:列表推导式与Lambda函数的高效应用
列表推导式和Lambda函数是Python中强大的工具。列表推导式允许在一行代码中生成新列表,而Lambda函数则是用于简单操作的匿名函数。通过示例展示了如何使用这些工具进行数据处理和功能实现,包括生成偶数平方、展平二维列表、按长度排序单词等。这些工具在Python编程中具有高度的灵活性和实用性。