前言
上篇文章我们讲解了Python re模块的简单使用,本篇文章我们将讲解re模块更高级的用法。
正则表达式量词符号与组
组的概念
符号 | 描述 |
---|---|
() | 在匹配规则中获取指定数据 |
贪婪与非贪婪
匹配分为贪婪匹配与非贪婪匹配
- 0次或多次属于贪婪模式
- 通过?组合变成非贪婪模式
正则表达式-re模块的函数
- findall()
查找字符串中所有(非重复)出现的正则表达式模式,并返回一个匹配列表
语法示例:
findall(pattern, string [,flags])
示例如下:
import re
sentence = 'hello muller, where are you from'
print(re.findall('from\Z', sentence))
print(re.findall('ffrom\Z', sentence))
--------------------------------
输出结果如下:
['from']
[]
- search()
使用可选标记搜索字符串中第一次岀现的正则表达式模式。如果匹配成功,则返回匹配对象;如果失败,则返回None
语法示例:
search(pattern, string, flags=0)
示例如下:
import re
sectence = 'i like play football'
result = re.search('(.*) (.*?) (.*)',sectence)
if result:
print('result.group() :',result.group())
print('result.group() :',result.group(1))
print('result.group() :',result.group(2))
print('result.group() :',result.group(3))
else:
print('no match!')
------------------------------------------
输出结果如下;
result.group() : i like play football
result.group() : i like
result.group() : play
result.group() : football
- group()与groups()
- group(num)返回整个匹配对象,或者编号为num的特定子组
- groups():返回一个包含所有匹配子组的元组(如果没有成功匹配,则返回一个空元组)
代码示例如下:
import re
sectence = 'hello messi, i am muller'
result = re.search('hello (.*), i am (.*)', sectence)
print(result.groups())
print(result.group(1))
print(result.group(2))
-----------------------
输出结果如下:
('messi', 'muller')
messi
muller
- split()正则替换
根据正则表达式的模式分隔符,split函数将字符串分割为列表,然后返回成功匹配的列表,分隔最多操作max次(默认分割所有匹配成功的位置)
语法如下:
split(pattern, string, max=0)
示例如下:
import re
s = "Long live the PRC"
result1 = re.split("\s", s)
print(result1)
result2 = re.split("\s", s, 3) # 通过指定 maxsplit 参数来控制出现次数
print(result2)
result3 = re.split("USA", s)
print(result3)
---------------------------------
输出结果如下:
['Long', 'live', 'the', 'PRC']
['Long', 'live', 'the', 'PRC']
['Long live the PRC']
- match()
使用带有可选的标记的正则表达式的模式来匹配字符串。如果匹配成功,就返回匹配对象;如果失败,就返回None
语法如下:
match(pattern, string, flags=0)
示例如下:
import re
data = 'hello world'
result = re.match('hello', data)
print(result.group())
------------------
输出结果如下:
hello
总结
本文介绍了re模块的几个常用函数,对Python内置的re模块的介绍就到这里了,后续我们将介绍其他模块的内容,敬请期待哈!