33.从入门到精通:Python3 正则表达式 re.match函数 re.search方法 re.match与re.search的区别

简介: 33.从入门到精通:Python3 正则表达式 re.match函数 re.search方法 re.match与re.search的区别

Python3 正则表达式

在 Python3 中,可以使用 re 模块来进行正则表达式的匹配和处理。
以下是一个简单的例子,说明如何使用 re 模块进行正则表达式匹配:

import re
# 要匹配的字符串
text = "Hello, world! This is a test."
# 匹配所有的单词
pattern = r"\w+"
matches = re.findall(pattern, text)
# 输出匹配结果
print(matches)

在这个例子中,首先定义了一个要匹配的字符串 text,然后使用 re.findall() 函数来匹配所有的单词。在正则表达式中,\w+ 表示匹配一个或多个字母、数字或下划线。最后输出匹配结果。

除了 re.findall() 函数之外,还有其他一些常用的函数,例如:

  • re.match():从字符串的开头开始匹配,只匹配一个结果。
  • re.search():在字符串中搜索匹配项,只匹配一个结果。
  • re.sub():替换字符串中的匹配项。

以下是一个更复杂的例子,说明如何使用正则表达式进行邮箱地址的验证:

import re
# 要验证的邮箱地址
email = "test@example.com"
# 邮箱地址的正则表达式
pattern = r"^[a-zA-Z0-9._%+-]+@[a-zA-Z0-9.-]+\.[a-zA-Z]{2,}$"
# 验证邮箱地址是否合法
if re.match(pattern, email):
    print("Valid email address")
else:
    print("Invalid email address")

在这个例子中,首先定义了一个要验证的邮箱地址 email,然后定义了一个正则表达式 pattern,用于匹配合法的邮箱地址。正则表达式中,^[a-zA-Z0-9._%+-]+表示匹配一个或多个字母、数字、点号、下划线、百分号、加号或减号,@[a-zA-Z0-9.-]+表示匹配一个或多个字母、数字、点号或减号,.[a-zA-Z]{2,}$ 表示匹配一个或多个字母,长度至少为 2,且以点号结尾。


最后使用 re.match() 函数验证邮箱地址是否合法。如果匹配成功,则输出 Valid email address,否则输出

Invalid email address。 需要注意的是,正则表达式的语法比较复杂,需要仔细理解和使用。在编写正则表达式时,可以使用在线工具来测试和调试,例如 Regex101 或 RegExr。


re.match函数

re.match()函数是Python中re模块中的一个函数,用于尝试从字符串的起始位置匹配一个正则表达式模式。如果匹配成功,match()函数返回一个匹配对象,否则返回None。

下面是一个简单的例子,说明如何使用re.match()函数:

import re
# 匹配以hello开头的字符串
pattern = r'hello'
string = 'hello world'
match_obj = re.match(pattern, string)
# 判断是否匹配成功
if match_obj:
    print('Match succeeded.')
else:
    print('Match failed.')

在这个例子中,首先定义了一个正则表达式模式,用于匹配以hello开头的字符串。然后定义了一个字符串,用于进行匹配。接着使用re.match()函数进行匹配,如果匹配成功,match()函数返回一个匹配对象,否则返回None。最后根据返回值判断匹配是否成功,并输出相应的提示信息。

需要注意的是,re.match()函数只会尝试从字符串的起始位置进行匹配。如果要匹配整个字符串,可以使用re.search()函数。如果要匹配多个字符串,可以使用re.findall()函数。


re.search方法

re.search() 方法是 Python 中 re 模块中的一个函数,用于在字符串中搜索匹配项。如果匹配成功,search() 函数返回一个匹配对象,否则返回 None。

以下是一个简单的例子,说明如何使用 re.search() 函数

import re
# 要搜索的字符串
text = "Hello, world! This is a test."
# 搜索包含单词 test 的字符串
pattern = r"test"
match_obj = re.search(pattern, text)
# 判断是否搜索成功
if match_obj:
    print("Match succeeded.")
    # 输出匹配结果
    print(match_obj.group())
else:
    print("Match failed.")
  • 在这个例子中,首先定义了一个要搜索的字符串 text,然后使用 re.search() 函数搜索包含单词 test的字符串。如果搜索成功,search() 函数返回一个匹配对象,否则返回 None。最后根据返回值判断搜索是否成功,并输出相应的提示信息。

需要注意的是,re.search() 函数只会搜索第一个匹配项。如果要搜索所有的匹配项,可以使用 re.findall() 函数。


re.match与re.search的区别

在 Python 的 re 模块中,re.match() 和 re.search() 都是用于正则表达式匹配的函数,但它们之间有一些区别。

re.match() 函数只匹配字符串的开头,如果字符串开头不符合正则表达式,则匹配失败,返回 None。例如:

import re
text = "hello world"
pattern = r"world"
match_obj = re.match(pattern, text)
print(match_obj)  # None

在这个例子中,正则表达式 “world” 不匹配字符串 “hello world” 的开头,因此 re.match() 函数返回 None。

re.search() 函数匹配整个字符串,直到找到第一个符合正则表达式的子串。例如:

import re
text = "hello world"
pattern = r"world"
match_obj = re.search(pattern, text)
print(match_obj)  # <re.Match object; span=(6, 11), match='world'>

在这个例子中,正则表达式 “world” 匹配字符串 “hello world” 中的子串 “world”,因此 re.search()

函数返回一个匹配对象。


re.match() 函数只匹配字符串的开头,因此它的效率比 re.search() 函数高。如果只需要匹配字符串的开头,可以使用 re.match() 函数。例如:

import re
text = "hello world"
pattern = r"hello"
match_obj = re.match(pattern, text)
print(match_obj)  # <re.Match object; span=(0, 5), match='hello'>

在这个例子中,正则表达式 “hello” 匹配字符串 “hello world” 的开头,因此 re.match() 函数返回一个匹配对象。


需要注意的是,re.match() 和 re.search() 函数都只匹配第一个符合正则表达式的子串。如果需要匹配所有符合条件的子串,可以使用 re.findall() 函数。


相关文章
|
1月前
|
API 数据库 Python
除了正则表达式,还有哪些方法可以验证用户输入数据的格式?
除了正则表达式,还有哪些方法可以验证用户输入数据的格式?
115 79
|
3月前
|
搜索推荐 Python
利用Python内置函数实现的冒泡排序算法
在上述代码中,`bubble_sort` 函数接受一个列表 `arr` 作为输入。通过两层循环,外层循环控制排序的轮数,内层循环用于比较相邻的元素并进行交换。如果前一个元素大于后一个元素,就将它们交换位置。
155 67
|
1月前
|
Python
[oeasy]python057_如何删除print函数_dunder_builtins_系统内建模块
本文介绍了如何删除Python中的`print`函数,并探讨了系统内建模块`__builtins__`的作用。主要内容包括: 1. **回忆上次内容**:上次提到使用下划线避免命名冲突。 2. **双下划线变量**:解释了双下划线(如`__name__`、`__doc__`、`__builtins__`)是系统定义的标识符,具有特殊含义。
32 3
|
1月前
|
JSON 监控 安全
深入理解 Python 的 eval() 函数与空全局字典 {}
`eval()` 函数在 Python 中能将字符串解析为代码并执行,但伴随安全风险,尤其在处理不受信任的输入时。传递空全局字典 {} 可限制其访问内置对象,但仍存隐患。建议通过限制函数和变量、使用沙箱环境、避免复杂表达式、验证输入等提高安全性。更推荐使用 `ast.literal_eval()`、自定义解析器或 JSON 解析等替代方案,以确保代码安全性和可靠性。
42 2
|
30天前
|
存储 人工智能 Python
[oeasy]python061_如何接收输入_input函数_字符串_str_容器_ 输入输出
本文介绍了Python中如何使用`input()`函数接收用户输入。`input()`函数可以从标准输入流获取字符串,并将其赋值给变量。通过键盘输入的值可以实时赋予变量,实现动态输入。为了更好地理解其用法,文中通过实例演示了如何接收用户输入并存储在变量中,还介绍了`input()`函数的参数`prompt`,用于提供输入提示信息。最后总结了`input()`函数的核心功能及其应用场景。更多内容可参考蓝桥、GitHub和Gitee上的相关教程。
16 0
|
2月前
|
Python
Python中的函数是**一种命名的代码块,用于执行特定任务或计算
Python中的函数是**一种命名的代码块,用于执行特定任务或计算
64 18
|
2月前
|
数据可视化 DataX Python
Seaborn 教程-绘图函数
Seaborn 教程-绘图函数
85 8
|
2月前
|
Python
Python中的函数
Python中的函数
62 8
|
C# Python
Python中的module,library,package之间的区别
背景 Python中有一些基本的名词,很多人,尤其是一些初学者,可能听着就很晕。 此处,简单总结一下,module,library,package之间的大概区别。 Python中的module的简介 module,中文翻译为:模块 Python中的module,说白了,就是Python文件,而python文件一般后缀为py,所以就是你的xxx.py而已。
1750 0
|
2月前
|
人工智能 数据可视化 数据挖掘
探索Python编程:从基础到高级
在这篇文章中,我们将一起深入探索Python编程的世界。无论你是初学者还是有经验的程序员,都可以从中获得新的知识和技能。我们将从Python的基础语法开始,然后逐步过渡到更复杂的主题,如面向对象编程、异常处理和模块使用。最后,我们将通过一些实际的代码示例,来展示如何应用这些知识解决实际问题。让我们一起开启Python编程的旅程吧!