Python正则表达式相关函数(学习笔记)

简介: Python正则表达式相关函数(学习笔记)

(1) re.match



match(pat,str) 从开始位置开始匹配,如果开头没有则无

import re
def look_for(p,s):
        return '没有找到' if re.search(p,s) is None else re.findall(p,s)
str="""
5
072003210 一一
1234567890男02/28/2022
6
072003210 二二
1034567890女01/23/2021
7
072003210 三三
1234167890男03/27/2020
"""
str

运行结果 str的内容:⬇

'\n5\n072003210 一一\n1234567890男02/28/2022\n6\n072003210 二二\n1034567890女01/23/2021\n7\n072003210 三三\n1234167890男03/27/2020\n'
print(re.match(r'一一',str))   #匹配不到,因为一一不是在开头
print(re.match(r'\n5',str))

运行结果:

None                        #匹配不到,因为一一不是在开头
<re.Match object; span=(0, 2), match='\n5'>

如果只想拿到要匹配的字符串,则使用group( )

l1='经济与管理T3大数据分析'
print(re.match(r'经济',l1).group())

运行结果:

经济


(2) re.search



search(pat,str) 搜索整个字符串

l1='经济与管理T3大数据分析'
print(re.search(r'经济',l1).group())
print(re.search(r'数据',l1))

运行结果:

经济
<re.Match object; span=(10, 12), match='数据'>


(3) re.findall



findall(pat,str) 搜索整个字符串,返回一个list

l1='经济economy经济金融数据分析数据data'
print(re.findall(r'经济',l1))
print(re.findall(r'数据',l1))

运行结果:

['经济', '经济']
['数据', '数据']


(4) re.finditer



finditer(pat,str) 以迭代器的方式输出,返回所有符合某个模型的字符串

比较一下finditerfindall的区别:

print([i for i in re.finditer(r'经',l1)])
print([i for i in re.findall(r'经',l1)])

运行结果:

[<re.Match object; span=(0, 1), match='经'>, <re.Match object; span=(9, 10), match='经'>]
['经', '经']


(5) re.split



split(pat,str) 以某个模型为分割点,拆分整个字符串为一系列字符串,以列表形式

str="""
5
072003210 一一
1234567890男02/28/2022
6
072003210 二二
1034567890女01/23/2021
7
072003210 三三
1234167890男03/27/2020
"""
l11=re.split(r'\n',str)
type(l11)

运行结果: 此时l11是list类型

list
l11

运行结果:l11的内容👇

['',
 '5',
 '072003210 一一',
 '1234567890男02/28/2022',
 '6',
 '072003210 二二',
 '1034567890女01/23/2021',
 '7',
 '072003210 三三',
 '1234167890男03/27/2020',
 '']


(6) re.sub



sub(pat,str) str中找到匹配某个模型的所有字符串,用其他字符串进行替代

l12=re.sub(r'/','-',l11)  

由于此时l11list类型,因此不能使用sub函数,会报错

d24239a021854360b559c7a06d607f90.png

必须改成数组形式

l12=re.sub(r'/','-',l11[3])  # 把/全部替换成-
l12

运行结果:

'1234567890男02-28-2022'


(7) re.compile



compile(pat) 对某个模型进行编译,以便后期使用

str0="""
'02/28/2022 08:00:00,91,T3大数据分析';
'02/28/2022 09:00:00,90,T3数据库原理与应用';
'02/28/2022 11:00:00,92,T3数据库营销';
"""
pat=r",([0-9]{2}),"
obj=re.compile(pat)
print(obj.match(str0))
print(obj.search(str0))
print(obj.findall(str0))
print([i for i in obj.finditer(str0)])

运行结果:

None
<re.Match object; span=(21, 25), match=',91,'>
['91', '90', '92']
[<re.Match object; span=(21, 25), match=',91,'>, <re.Match object; span=(55, 59), match=',90,'>, <re.Match object; span=(92, 96), match=',92,'>]

总结



正则表达式相关函数:

(1) re.match :从开始位置开始匹配,如果开头没有则无

match(pat,str)

(2) re.search :搜索整个字符串

search(pat,str)

(3) re.findall :搜索整个字符串,返回一个list

findall(pat,str)

(4) re.finditer :以迭代器的方式输出,返回所有符合某个模型的字符串

finditer(pat,str)

(5) re.split :以某个模型为分割点,拆分整个字符串为一系列字符串,以列表形式

split(pat,str)

(6) re.sub :str中找到匹配某个模型的所有字符串,用其他字符串进行替代

sub(pat,str)

(7) re.compile :对某个模型进行编译,以便后期使用

compile(pat)


相关文章
|
2月前
|
Python
【python从入门到精通】-- 第五战:函数大总结
【python从入门到精通】-- 第五战:函数大总结
79 0
|
20天前
|
搜索推荐 Python
利用Python内置函数实现的冒泡排序算法
在上述代码中,`bubble_sort` 函数接受一个列表 `arr` 作为输入。通过两层循环,外层循环控制排序的轮数,内层循环用于比较相邻的元素并进行交换。如果前一个元素大于后一个元素,就将它们交换位置。
124 67
|
14天前
|
Python
Python中的函数是**一种命名的代码块,用于执行特定任务或计算
Python中的函数是**一种命名的代码块,用于执行特定任务或计算
42 18
|
5天前
|
数据可视化 DataX Python
Seaborn 教程-绘图函数
Seaborn 教程-绘图函数
36 8
|
15天前
|
Python
Python中的函数
Python中的函数
31 8
|
22天前
|
监控 测试技术 数据库
Python中的装饰器:解锁函数增强的魔法####
本文深入探讨了Python语言中一个既强大又灵活的特性——装饰器(Decorator),它以一种优雅的方式实现了函数功能的扩展与增强。不同于传统的代码复用机制,装饰器通过高阶函数的形式,为开发者提供了在不修改原函数源代码的前提下,动态添加新功能的能力。我们将从装饰器的基本概念入手,逐步解析其工作原理,并通过一系列实例展示如何利用装饰器进行日志记录、性能测试、事务处理等常见任务,最终揭示装饰器在提升代码可读性、维护性和功能性方面的独特价值。 ####
|
29天前
|
Python
Python中的`range`函数与负增长
在Python中,`range`函数用于生成整数序列,支持正向和负向增长。本文详细介绍了如何使用`range`生成负增长的整数序列,并提供了多个实际应用示例,如反向遍历列表、生成倒计时和计算递减等差数列的和。通过这些示例,读者可以更好地掌握`range`函数的使用方法。
45 5
|
1月前
|
Python
在Python中,可以使用内置的`re`模块来处理正则表达式
在Python中,可以使用内置的`re`模块来处理正则表达式
46 5
|
2月前
|
Python
Python之函数详解
【10月更文挑战第12天】
Python之函数详解
|
2月前
|
存储 数据安全/隐私保护 索引