Python——正则表达式

简介: python正则表达式的复习

常用的匹配规则

\w 匹配字母
\W 匹配不是字母,数字以及下划线的字符
\s 匹配任意空白字符
\S 匹配任意非空字符
\d 匹配任意数字,等价于[0-9]
\D 匹配任意非数字

常用方法match

match会尝试从字符串的起始位置开始匹配正则表达式,如果匹配就返回匹配的结果,不匹配则返回None,
match的两个参数。第一个传入正则表达式,第二个传入字符串,我们还可以通过group()来获取结果,group()会输出完整的匹配结果,然后group(1)会输出第一个被包围的匹配结果

通用匹配

.*可以匹配任意字符

贪婪匹配和非贪婪匹配

贪婪匹配是匹配尽量多的字符,而非贪婪匹配则是匹配尽可能少的字符,所以在匹配时尽量使用非贪婪匹配,以免出现匹配结果缺失的情况。

转义匹配

正则表达式如果匹配的字符串包含着换行之类的特殊字符,就要对其进行转义匹配,

search

match方法是从字符串的开头开始匹配,如果开头匹配失败,则匹配失败,则我们需要search方法来进行,他在匹配时会扫描整个字符串,直到找到第一个符合规则的字符串,然后匹配内容,当内容中含有换行时,第三个参数需要传入re.S

findall

想要获取到与正则表达式匹配的所有,就需要借助到findall方法。

sub

除了用正则表达式提取信息,还需要它来修改文本

compile

可以将一个正则表达式编译成一个正则表达式对象

相关文章
|
4月前
|
Python
"揭秘!Python如何运用神秘的正则表达式,轻松穿梭于网页迷宫,一键抓取隐藏链接?"
【8月更文挑战第21天】Python凭借其强大的编程能力,在数据抓取和网页解析领域表现出高效与灵活。通过结合requests库进行网页请求及正则表达式进行复杂文本模式匹配,可轻松提取网页信息。本示例展示如何使用Python和正则表达式解析网页链接。首先确保已安装requests库,可通过`pip install requests`安装。接着,利用requests获取网页内容,并使用正则表达式提取所有`<a>`标签的`href`属性。
48 0
|
15天前
|
Python
在Python中,可以使用内置的`re`模块来处理正则表达式
在Python中,可以使用内置的`re`模块来处理正则表达式
37 5
|
20天前
|
数据采集 Web App开发 iOS开发
如何使用 Python 语言的正则表达式进行网页数据的爬取?
使用 Python 进行网页数据爬取的步骤包括:1. 安装必要库(requests、re、bs4);2. 发送 HTTP 请求获取网页内容;3. 使用正则表达式提取数据;4. 数据清洗和处理;5. 循环遍历多个页面。通过这些步骤,可以高效地从网页中提取所需信息。
|
2月前
|
Python
【收藏备用】Python正则表达式的7个实用技巧
【收藏备用】Python正则表达式的7个实用技巧
24 1
|
2月前
|
数据安全/隐私保护 Python
Python实用正则表达式归纳
Python实用正则表达式归纳
|
2月前
|
Python
Python 正则表达式高级应用指南
正则表达式是文本模式匹配的强大工具,Python 的 `re` 模块支持其操作。本文介绍正则表达式的高级应用,包括复杂模式匹配(如邮箱、电话号码)、分组与提取、替换操作、多行匹配以及贪婪与非贪婪模式的区别。通过示例代码展示了如何灵活运用这些技巧解决实际问题。
31 7
|
2月前
|
JavaScript 前端开发 Scala
Python学习十:正则表达式
这篇文章是关于Python中正则表达式的使用,包括re模块的函数、特殊字符、匹配模式以及贪婪与非贪婪模式的详细介绍。
18 0
|
2月前
|
数据采集 开发者 Python
Python正则表达式之re.compile函数
`re.compile`是Python正则表达式处理中一个强大的工具,它通过预先编译正则表达式,不仅提升了执行效率,还增强了代码的组织性和可读性。掌握其使用,对于涉及文本分析、数据清洗、日志处理等领域的Python开发者来说,是非常必要的技能。正确并高效地应用这一功能,可以显著提升程序的性能和维护性。
91 0
|
3月前
|
索引 Python
30天拿下Python之正则表达式
30天拿下Python之正则表达式
17 0
|
3月前
|
数据采集 Python
Python正则表达式提取车牌号
Python正则表达式提取车牌号