Python正则表达式re库的使用

简介: 指导思想:正则表达式只是一个工具,学会其中一种使用方法即可1. ()和re.findall结合使用({}{})中第一个大括号替换为.则表示匹配所有字符,替换为[]则表示匹配中括号内限定的字符;第二个大括号替换为*则表示匹配长度为>=0,替换为+则表示匹配长度为>=1,替换为空则表示匹配长度为1(.*)表示匹配任意长度的所有字符([0-9]*)表示匹配任意长度的数字([0-9,a-z])表示匹配长度为1的数字和小写字母re.findall函数需要传入2个参数,第1个参数是正则表达式,第2个参数是要进行搜索的源字符串。

指导思想:正则表达式只是一个工具,学会其中一种使用方法即可

1. ()和re.findall结合使用

({}{})中第一个大括号替换为.则表示匹配所有字符,替换为[]则表示匹配中括号内限定的字符;
第二个大括号替换为*则表示匹配长度为>=0,替换为+则表示匹配长度为>=1,替换为空则表示匹配长度为1
(.*)表示匹配任意长度的所有字符
([0-9]*)表示匹配任意长度的数字
([0-9,a-z])表示匹配长度为1的数字和小写字母
re.findall函数需要传入2个参数,第1个参数是正则表达式,第2个参数是要进行搜索的源字符串。
re.findall函数返回结果的数据类型为列表,列表中的第1个元素的数据类型为元祖。

示例代码如下:

import re

if __name__ == "__main__":
    sourceStr = "11房5厅8卫"
    sourceStr2 = "a房b厅3卫"
    pattern_all = "(.*)房(.*)厅(.*)卫"
    pattern_number = "([0-9]*)房([0-9]*)厅([0-9]*)卫"
    pattern_numberAndLetter = "([0-9,a-z])房([0-9,a-z])厅([0-9,a-z])卫"
    print("正则表达式找出中间的字符:")
    result = re.findall(pattern_all, sourceStr)
    print(result,type(result),type(result[0]))
    print(re.findall(pattern_all,sourceStr2))
    print("正则表达式找出中间的数字")
    print(re.findall(pattern_number,sourceStr))
    print(re.findall(pattern_number,sourceStr2))
    print("正则表达式找出中间的数字和字母")
    print(re.findall(pattern_numberAndLetter, sourceStr))
    print(re.findall(pattern_numberAndLetter, sourceStr2))

上面一段代码的运行结果如下:

正则表达式找出中间的字符:
[('11', '5', '8')] <class 'list'> <class 'tuple'>
[('a', 'b', '3')]
正则表达式找出中间的数字
[('11', '5', '8')]
[]
正则表达式找出中间的数字和字母
[('1', '5', '8')]
[('a', 'b', '3')]

2. 正则表达式中的元字符

\s 用于匹配单个空格符,包括tab键和换行符; 
\S 用于匹配除单个空格符之外的所有字符; 
\d 用于匹配从0到9的数字; 
\w 用于匹配字母,数字或下划线字符; 
\W 用于匹配所有与\w不匹配的字符; 
.  用于匹配除换行符之外的所有字符。
例如上一节中的([0-9]*)与([\d]*)作用相同

3. ()和re.search结合使用

re.search函数需要传入2个参数,第1个参数是正则表达式,第2个参数是要进行搜索的源字符串。
re.search函数返回结果的数据类型是sre.SRE_Match对象,span=(3,9)是匹配结果的索引,从索引3开始,不包括索引9。
把re.search函数返回结果赋值给result,通过result.group函数获取匹配结果,result.group函数需要传入1个参数,参数的数据类型为无符号整型,参数为0时,为正则表达式匹配到的长句内容;参数为1时,为正则表达式匹配到的第1个小括号中的内容;参数为2时,为正则表达式匹配到的第2个小括号中的内容,依此类推。
示例代码如下:

import re

if __name__ == "__main__":
    sourceStr = "户型:3室2厅2卫"
    pattern_all = "([\d]*)室(.)厅(.)卫"
    result = re.search(pattern_all,sourceStr)
    print(result)
    print(result.group(0))
    print(result.group(1))
    print(result.group(2))
    print(result.group(3))

上面一段代码的运行结果如下:

<_sre.SRE_Match object; span=(3, 9), match='3室2厅2卫'>
3室2厅2卫
3
2
2

4 re.match的使用

re,match在实际应用中很少,不建议使用。
re.match能够匹配的前提是必须字符串索引0的位置能够匹配到。

import re
if __name__ == "__main__":
    re1 = "hel."
    re2 = ".el"
    re3 = ".hel"
    re4 = "el"
    sourceStr = "hello"
    print(re.match(re1,sourceStr))
    print(re.match(re2,sourceStr))
    print(re.match(re3,sourceStr))
    print(re.match(re3,sourceStr))

上面一段代码的运行结果如下:

<_sre.SRE_Match object; span=(0, 4), match='hell'>
<_sre.SRE_Match object; span=(0, 3), match='hel'>
None
None

目录
相关文章
|
4天前
|
调度 开发者 Python
Python中的异步编程:理解asyncio库
在Python的世界里,异步编程是一种高效处理I/O密集型任务的方法。本文将深入探讨Python的asyncio库,它是实现异步编程的核心。我们将从asyncio的基本概念出发,逐步解析事件循环、协程、任务和期货的概念,并通过实例展示如何使用asyncio来编写异步代码。不同于传统的同步编程,异步编程能够让程序在等待I/O操作完成时释放资源去处理其他任务,从而提高程序的整体效率和响应速度。
|
7天前
|
数据采集 存储 数据挖掘
Python数据分析:Pandas库的高效数据处理技巧
【10月更文挑战第27天】在数据分析领域,Python的Pandas库因其强大的数据处理能力而备受青睐。本文介绍了Pandas在数据导入、清洗、转换、聚合、时间序列分析和数据合并等方面的高效技巧,帮助数据分析师快速处理复杂数据集,提高工作效率。
27 0
|
6天前
|
数据采集 JSON 测试技术
Python爬虫神器requests库的使用
在现代编程中,网络请求是必不可少的部分。本文详细介绍 Python 的 requests 库,一个功能强大且易用的 HTTP 请求库。内容涵盖安装、基本功能(如发送 GET 和 POST 请求、设置请求头、处理响应)、高级功能(如会话管理和文件上传)以及实际应用场景。通过本文,你将全面掌握 requests 库的使用方法。🚀🌟
27 7
|
3天前
|
数据采集 Web App开发 iOS开发
如何使用 Python 语言的正则表达式进行网页数据的爬取?
使用 Python 进行网页数据爬取的步骤包括:1. 安装必要库(requests、re、bs4);2. 发送 HTTP 请求获取网页内容;3. 使用正则表达式提取数据;4. 数据清洗和处理;5. 循环遍历多个页面。通过这些步骤,可以高效地从网页中提取所需信息。
|
7天前
|
机器学习/深度学习 数据采集 算法
Python机器学习:Scikit-learn库的高效使用技巧
【10月更文挑战第28天】Scikit-learn 是 Python 中最受欢迎的机器学习库之一,以其简洁的 API、丰富的算法和良好的文档支持而受到开发者喜爱。本文介绍了 Scikit-learn 的高效使用技巧,包括数据预处理(如使用 Pipeline 和 ColumnTransformer)、模型选择与评估(如交叉验证和 GridSearchCV)以及模型持久化(如使用 joblib)。通过这些技巧,你可以在机器学习项目中事半功倍。
18 3
|
6天前
|
文字识别 自然语言处理 API
Python中的文字识别利器:pytesseract库
`pytesseract` 是一个基于 Google Tesseract-OCR 引擎的 Python 库,能够从图像中提取文字,支持多种语言,易于使用且兼容性强。本文介绍了 `pytesseract` 的安装、基本功能、高级特性和实际应用场景,帮助读者快速掌握 OCR 技术。
27 0
|
1月前
|
Python
pip批量安装Python库 requirement.txt 离线环境无互联网环境下pip安装Python库
pip批量安装Python库 requirement.txt 离线环境无互联网环境下pip安装Python库
89 3
|
5月前
|
开发工具 git Python
安装和使用`libnum`是一个用于数字理论函数的Python库
【6月更文挑战第19天】`libnum`是Python的数字理论函数库。安装可通过`git clone`,进入目录后运行`python setup.py install`,也可用`pip install libnum`。示例:使用`int_to_hex`将十进制数42转换为十六进制字符串&#39;2a&#39;。注意,信息可能已过时,应查最新文档以确保准确性。如遇问题,参考GitHub仓库或寻求社区帮助。
115 1
|
4月前
|
Python
确保你已经安装了`python-barcode`库。如果没有,可以通过pip来安装:
确保你已经安装了`python-barcode`库。如果没有,可以通过pip来安装:
|
Python
Anaconda虚拟环境安装Python库与Spyder
本文介绍在Anaconda中,为Python的虚拟环境安装第三方库与Spyder等配套软件的方法~
429 1
Anaconda虚拟环境安装Python库与Spyder