【Python零基础入门篇 · 25】:正则基础、正则的高级用法、贪婪匹配与非贪婪匹配、原生字符串

简介: 【Python零基础入门篇 · 25】:正则基础、正则的高级用法、贪婪匹配与非贪婪匹配、原生字符串

一、正则基础


  • 导入模块:import re


  • 使用math方法进行匹配操作


res = re.match(正则表达式,要匹配的字符串)


re.match()从字符串的开始位置进行匹配,配对成功返回match对象。,没有匹配成功返回None


  • 匹配到数据,使用group方法获取数据


print(res.group())



示例:

fccdd2c5ffdf40719546e1d63d5e94b8.png


1、匹配单个字符


  • “.”——匹配任意一个字符(除了\n之外)

a88ac82338854618b4dff3dc27f2a1aa.png


  • “[]”——匹配[]中列举的字符


52664b2271a24983a068543bcd2a2a73.png


下图报错原因:由于没有匹配到元素,之后又调用了group()方法造成的。

73edbc3b4ec2473b9a2a4a81a600bcb7.png


  • “\d”——匹配数字


0,1,2,3,4,5,6,7,8,9

1f0a92a258da4703ba56f35e071746fd.png


  • “\D”——匹配非数字,即不是数字

cf391525cee64c1cb9bc453f50f624e9.png



  • “\s”——匹配空白,即空格和tab键

959b54cd71e34ebfa79f9ad3e895fd92.png


  • “\S”——匹配非空白


2ab01c362fd44205aeb699c180c43aac.png



  • “\w”——匹配单词字符


a-z,A-Z,0-9,_(下划线),汉字

287be41bdf5f41ab9fafcea89be138cd.png


  • “\W”——匹配非单词字符

b3a6af05c6ff40c381bb51f435985be9.png


2、匹配多个字符


  • “ * ” ——匹配前一个字符出现0次或无限次

44cdb23b667646f78676917de02a283d.png


  • “ + ” ——匹配前一个字符出现一次或无限次

976adc2125254447bdb9e4a785e45f2f.png


  • “ ?” ——匹配前一个字符出现一次或0次,即要么有一次,要么没有

4f019c4ae2f4478eb7982b97e5380409.png67892c03a17c4a3785317cf47252675f.png



3、匹配开头结尾


  • “ ^ ” ——匹配字符串开头


^表示以什么开头,表示对什么取反。

71a2ac26975d4ce09bbe37314421cdf8.png


^在[]外表示由[]中的各个字符开头就匹配成功


^[ab] :表示以'a'或'b'开头就匹配成功

66c40361246e4ec3adb644868371788f.png


  • “ $ ” ——匹配字符串结尾

4e657926a4614965a5137cc3b38f5538.png


b44be35668a743e5bddda50fdb0bb026.png

f6c3bc0c9591425c9c275315f06c78bc.png


4、不匹配


  • ^在[]中表示不匹配

9c1da61839ec44e3a2917a1e4b332bba.png


5、总结


  • ‘abc’:表示字符串开头有abc就匹配成功


  • '[abc]':表示以字符串开头有'a'或'b'或'c'就匹配成功


  • '^[abc]':表示由'a'或'b'或'c'开头就匹配成功


  • '[^abc]':表示匹配除了'a'、'b'、‘c’之外的字符

6、匹配分组


  • “ | ”——匹配左右任意一个表达式(从左到右进行匹配)


19f0c351474e4bfdb934c3a69066c8cd.png


  • (ab)——括号中字符作为一个分组

41cb929a8dc041a0a711ada52d89644e.png

9522bcfb38d44fe8be957f00949b025d.png

  • \num——引用分组num匹配到的字符串

f4b58c9c9e054f118a6eeb293dca04aa.png


  • (?P<name>)分组起别名


(?P=name)引用别名为name分组匹配到的字符串

900f28d1faff41e099601d3f2639b13b.png




二、正则的高级用法


  • search()

会扫描整个字符串并返回第一个成功的匹配


  • search()和match()的区别:match()从开始位置匹配;search()扫描全部,找到第一个匹配成功的数据。

f3aecc27304b4bdfa5e9a9fceaf28efe.png


  • findall()——列表形式返回字符串


以列表形式返回匹配到的字符串

从头到尾匹配,找到所有匹配成功的数据,返回一个列表。

f4fa1171bde64ab9a7b71956a0b738e9.png


  • sub()——数据替换


将匹配到的数据进行替换

语法:sub(正则表达式,新内容,字符串,指定替换的次数)


  • 正则表达式代表需要被替换的,也就是字符串里的旧内容

0f045510a57b4bd8964103d278f78b45.png

  • split()——切割字符串


根据匹配进行切割字符串,并返回一个列表


语法:split(正则表达式,字符串,指定最大分割次数)

c71c1f53e6bf41c68e1e6aa937e0310d.png



三、贪婪匹配和非贪婪匹配


贪婪匹配:在满足匹配时,匹配尽可能长的字符串,默认情况下,采用贪婪匹配。


非贪婪匹配:在满足匹配时,匹配尽可能短的字符串,使用“ ? ”来表示非贪婪匹配。


  • 在 *,+,{m,n}等后面加上“?”表示使贪婪变为非贪婪


007c5b3850834276bed8c5b8f902b284.png

646c70d1af3c4e4fb5751316af032083.png

bec435849c49479ca3faf762367a59f0.png

796bc82e63d24dab91be212bb7bcc22a.png

502c38a5011c440bbc0914989042a392.png



四、原生字符串


正则表达式中,匹配字符串中的字符“ \ ”,需要四个反斜杠:\\\\


7514138fff83466dba8ef72ecd62e449.png

1d07bd2ed77e4be897013477361cb53b.png


相关文章
|
5天前
|
人工智能 算法 Python
【随手记】python的heapq库的基本用法
【随手记】python的heapq库的基本用法
17 1
|
10天前
|
Python
使用Python处理字符串。
使用Python处理字符串。
|
10天前
|
算法框架/工具 索引 Python
Python基础教程(第3版)中文版 第三章 使用字符串(笔记)
Python基础教程(第3版)中文版 第三章 使用字符串(笔记)
|
3天前
|
存储 缓存 Python
深入了解python中元类和连接符的用法
【6月更文挑战第20天】本文介绍包括`type`的多重用途,内建函数的常量,模块属性,类继承的概念,元类的工作原理,可哈希对象的重要性,加权平均值的计算,以及如何找到两个列表的交集。
35 5
深入了解python中元类和连接符的用法
|
2天前
|
自然语言处理 JavaScript 前端开发
Python高级语法与正则表达式(二)
正则表达式描述了一种字符串匹配的模式,可以用来检查一个串是否含有某种子串、将匹配的子串做替换或者从某个串中取出符合某个条件的子串等。
|
2天前
|
安全 算法 Python
Python高级语法与正则表达式(一)
Python提供了 with 语句的写法,既简单又安全。 文件操作的时候使用with语句可以自动调用关闭文件操作,即使出现异常也会自动关闭文件操作。
|
4天前
|
存储 索引 Python
Python教程:深入了解 Python 中 Dict、List、Tuple、Set 的高级用法
Python 中的 Dict(字典)、List(列表)、Tuple(元组)和 Set(集合)是常用的数据结构,它们各自有着不同的特性和用途。在本文中,我们将深入了解这些数据结构的高级用法,并提供详细的说明和代码示例。
12 2
|
5天前
|
Python
Python Tkinter之variable用法
Python Tkinter之variable用法
10 3
|
9天前
|
Python 索引
【Python字符串攻略】:玩转文字,编织程序的叙事艺术
【Python字符串攻略】:玩转文字,编织程序的叙事艺术
|
9天前
|
Python
刷题——Python篇(3)字符串
刷题——Python篇(3)字符串