Python正则表达式re库的使用

简介: 指导思想:正则表达式只是一个工具,学会其中一种使用方法即可1. ()和re.findall结合使用({}{})中第一个大括号替换为.则表示匹配所有字符,替换为[]则表示匹配中括号内限定的字符;第二个大括号替换为*则表示匹配长度为>=0,替换为+则表示匹配长度为>=1,替换为空则表示匹配长度为1(.*)表示匹配任意长度的所有字符([0-9]*)表示匹配任意长度的数字([0-9,a-z])表示匹配长度为1的数字和小写字母re.findall函数需要传入2个参数,第1个参数是正则表达式,第2个参数是要进行搜索的源字符串。

指导思想:正则表达式只是一个工具,学会其中一种使用方法即可

1. ()和re.findall结合使用

({}{})中第一个大括号替换为.则表示匹配所有字符,替换为[]则表示匹配中括号内限定的字符;
第二个大括号替换为*则表示匹配长度为>=0,替换为+则表示匹配长度为>=1,替换为空则表示匹配长度为1
(.*)表示匹配任意长度的所有字符
([0-9]*)表示匹配任意长度的数字
([0-9,a-z])表示匹配长度为1的数字和小写字母
re.findall函数需要传入2个参数,第1个参数是正则表达式,第2个参数是要进行搜索的源字符串。
re.findall函数返回结果的数据类型为列表,列表中的第1个元素的数据类型为元祖。

示例代码如下:

import re

if __name__ == "__main__":
    sourceStr = "11房5厅8卫"
    sourceStr2 = "a房b厅3卫"
    pattern_all = "(.*)房(.*)厅(.*)卫"
    pattern_number = "([0-9]*)房([0-9]*)厅([0-9]*)卫"
    pattern_numberAndLetter = "([0-9,a-z])房([0-9,a-z])厅([0-9,a-z])卫"
    print("正则表达式找出中间的字符:")
    result = re.findall(pattern_all, sourceStr)
    print(result,type(result),type(result[0]))
    print(re.findall(pattern_all,sourceStr2))
    print("正则表达式找出中间的数字")
    print(re.findall(pattern_number,sourceStr))
    print(re.findall(pattern_number,sourceStr2))
    print("正则表达式找出中间的数字和字母")
    print(re.findall(pattern_numberAndLetter, sourceStr))
    print(re.findall(pattern_numberAndLetter, sourceStr2))

上面一段代码的运行结果如下:

正则表达式找出中间的字符:
[('11', '5', '8')] <class 'list'> <class 'tuple'>
[('a', 'b', '3')]
正则表达式找出中间的数字
[('11', '5', '8')]
[]
正则表达式找出中间的数字和字母
[('1', '5', '8')]
[('a', 'b', '3')]

2. 正则表达式中的元字符

\s 用于匹配单个空格符,包括tab键和换行符; 
\S 用于匹配除单个空格符之外的所有字符; 
\d 用于匹配从0到9的数字; 
\w 用于匹配字母,数字或下划线字符; 
\W 用于匹配所有与\w不匹配的字符; 
.  用于匹配除换行符之外的所有字符。
例如上一节中的([0-9]*)与([\d]*)作用相同

3. ()和re.search结合使用

re.search函数需要传入2个参数,第1个参数是正则表达式,第2个参数是要进行搜索的源字符串。
re.search函数返回结果的数据类型是sre.SRE_Match对象,span=(3,9)是匹配结果的索引,从索引3开始,不包括索引9。
把re.search函数返回结果赋值给result,通过result.group函数获取匹配结果,result.group函数需要传入1个参数,参数的数据类型为无符号整型,参数为0时,为正则表达式匹配到的长句内容;参数为1时,为正则表达式匹配到的第1个小括号中的内容;参数为2时,为正则表达式匹配到的第2个小括号中的内容,依此类推。
示例代码如下:

import re

if __name__ == "__main__":
    sourceStr = "户型:3室2厅2卫"
    pattern_all = "([\d]*)室(.)厅(.)卫"
    result = re.search(pattern_all,sourceStr)
    print(result)
    print(result.group(0))
    print(result.group(1))
    print(result.group(2))
    print(result.group(3))

上面一段代码的运行结果如下:

<_sre.SRE_Match object; span=(3, 9), match='3室2厅2卫'>
3室2厅2卫
3
2
2

4 re.match的使用

re,match在实际应用中很少,不建议使用。
re.match能够匹配的前提是必须字符串索引0的位置能够匹配到。

import re
if __name__ == "__main__":
    re1 = "hel."
    re2 = ".el"
    re3 = ".hel"
    re4 = "el"
    sourceStr = "hello"
    print(re.match(re1,sourceStr))
    print(re.match(re2,sourceStr))
    print(re.match(re3,sourceStr))
    print(re.match(re3,sourceStr))

上面一段代码的运行结果如下:

<_sre.SRE_Match object; span=(0, 4), match='hell'>
<_sre.SRE_Match object; span=(0, 3), match='hel'>
None
None

目录
相关文章
|
6月前
|
存储 人工智能 测试技术
如何使用LangChain的Python库结合DeepSeek进行多轮次对话?
本文介绍如何使用LangChain结合DeepSeek实现多轮对话,测开人员可借此自动生成测试用例,提升自动化测试效率。
1367 125
如何使用LangChain的Python库结合DeepSeek进行多轮次对话?
|
6月前
|
监控 数据可视化 数据挖掘
Python Rich库使用指南:打造更美观的命令行应用
Rich库是Python的终端美化利器,支持彩色文本、智能表格、动态进度条和语法高亮,大幅提升命令行应用的可视化效果与用户体验。
526 0
|
5月前
|
数据可视化 关系型数据库 MySQL
【可视化大屏】全流程讲解用python的pyecharts库实现拖拽可视化大屏的背后原理,简单粗暴!
本文详解基于Python的电影TOP250数据可视化大屏开发全流程,涵盖爬虫、数据存储、分析及可视化。使用requests+BeautifulSoup爬取数据,pandas存入MySQL,pyecharts实现柱状图、饼图、词云图、散点图等多种图表,并通过Page组件拖拽布局组合成大屏,支持多种主题切换,附完整源码与视频讲解。
562 4
【可视化大屏】全流程讲解用python的pyecharts库实现拖拽可视化大屏的背后原理,简单粗暴!
|
5月前
|
传感器 运维 前端开发
Python离群值检测实战:使用distfit库实现基于分布拟合的异常检测
本文解析异常(anomaly)与新颖性(novelty)检测的本质差异,结合distfit库演示基于概率密度拟合的单变量无监督异常检测方法,涵盖全局、上下文与集体离群值识别,助力构建高可解释性模型。
475 10
Python离群值检测实战:使用distfit库实现基于分布拟合的异常检测
|
7月前
|
运维 Linux 开发者
Linux系统中使用Python的ping3库进行网络连通性测试
以上步骤展示了如何利用 Python 的 `ping3` 库来检测网络连通性,并且提供了基本错误处理方法以确保程序能够优雅地处理各种意外情形。通过简洁明快、易读易懂、实操性强等特点使得该方法非常适合开发者或系统管理员快速集成至自动化工具链之内进行日常运维任务之需求满足。
478 18
Python 内置正则表达式库re的使用
正则表达式是记录文本规则的代码,用于查找和处理符合特定规则的字符串。在Python中,常通过原生字符串`r&#39;string&#39;`表示。使用`re.compile()`创建正则对象,便于多次使用。匹配字符串有`match()`(从开头匹配)、`search()`(搜索首个匹配)和`findall()`(找所有匹配)。替换字符串用`sub()`,分割字符串则用`split()`。
|
数据库 Python
Python网络数据抓取(8):正则表达式
Python网络数据抓取(8):正则表达式
|
自然语言处理 JavaScript 前端开发
Python高级语法与正则表达式(二)
正则表达式描述了一种字符串匹配的模式,可以用来检查一个串是否含有某种子串、将匹配的子串做替换或者从某个串中取出符合某个条件的子串等。
|
安全 算法 Python
Python高级语法与正则表达式(一)
Python提供了 with 语句的写法,既简单又安全。 文件操作的时候使用with语句可以自动调用关闭文件操作,即使出现异常也会自动关闭文件操作。
Python使用正则表达式分割字符串
在Python中,你可以使用re模块的split()函数来根据正则表达式分割字符串。这个函数的工作原理类似于Python内置的str.split()方法,但它允许你使用正则表达式作为分隔符。

推荐镜像

更多