常用的匹配规则
\w 匹配字母
\W 匹配不是字母,数字以及下划线的字符
\s 匹配任意空白字符
\S 匹配任意非空字符
\d 匹配任意数字,等价于[0-9]
\D 匹配任意非数字
常用方法match
match会尝试从字符串的起始位置开始匹配正则表达式,如果匹配就返回匹配的结果,不匹配则返回None,
match的两个参数。第一个传入正则表达式,第二个传入字符串,我们还可以通过group()来获取结果,group()会输出完整的匹配结果,然后group(1)会输出第一个被包围的匹配结果
通用匹配
.*可以匹配任意字符
贪婪匹配和非贪婪匹配
贪婪匹配是匹配尽量多的字符,而非贪婪匹配则是匹配尽可能少的字符,所以在匹配时尽量使用非贪婪匹配,以免出现匹配结果缺失的情况。
转义匹配
正则表达式如果匹配的字符串包含着换行之类的特殊字符,就要对其进行转义匹配,
search
match方法是从字符串的开头开始匹配,如果开头匹配失败,则匹配失败,则我们需要search方法来进行,他在匹配时会扫描整个字符串,直到找到第一个符合规则的字符串,然后匹配内容,当内容中含有换行时,第三个参数需要传入re.S
findall
想要获取到与正则表达式匹配的所有,就需要借助到findall方法。
sub
除了用正则表达式提取信息,还需要它来修改文本
compile
可以将一个正则表达式编译成一个正则表达式对象