一日一技:一个括号两种意思,正则表达式奇怪的小括号

简介: 一日一技:一个括号两种意思,正则表达式奇怪的小括号

在Python里面,当我们要从一段正则表达式中提取出一部分内容的时候,我们可以把这部分内容用小括号包起来。例如:从字符串 我的密码123456abc中提取 123456abc,我们可以这样写正则表达式:

import re
s = '我的密码123456abc'
password = re.findall('密码(.*?)$', s)
print(password)

运行效果如下图所示:

在这个例子里面,小括号的意思是“分组”。

但是,在正则表达式里面,小括号还有另外一个意思,那就是把几个符号放在一起,作为一个整体。

例如,还有另一个字符串 我的口令123456abc,这里密码前面是 口令,为了使用同一个正则表达式来从这两个句子里面提取密码,那么需要表达 密码或口令(.*?)$这个意思。

但如果我们这样写:

  1. 密码|口令(.*?)$

它实际上表达的意思是 密码令(.*?)$或者 密口令(.*?)$

所以我们需要把 (密码)口令作为整体来看待。此时,正则表达式本身支持使用括号来表示:

  1. (密码|口令)(.*?)$

在正则表达式里面,小括号内部的 |左右两侧的多个字符串会作为整体,这样就能表示 密码(.*?)$口令(.*?)$了。

但是,正则表达式里面作为整体的小括号,与Python里面用来分组的小括号发生了冲突,于是我们会发现提取出来的内容并不是我们想要的:

可以看到,这里, (密码|口令)它同时即有正则表达式里面作为整体的功能,又有Python里面分组的功能。于是结果就多出来了我们不想要的东西。

那么有什么办法让 (密码|口令)只实现正则表达式里面的作为整体的功能,不实现Python里面的分组功能呢?这个时候就需要使用正则表达式里面的一个组合符号 ?:了。

请大家对比下面三个结果:

可以看到, >.*?<<(?:.*?)>的作用是一样的。这就说明,以 ?:开头的小括号,它失去了分组的功能。

因此,我们把这个特征用到一开始的例子中:

>>> import re
>>> s = '我的密码123456abc'
>>> re.findall('(?:密码|口令)(.*?)$', s)
['123456abc']
>>> s = '我的口令123456abc'
>>> re.findall('(?:密码|口令)(.*?)$', s)
['123456abc']

运行效果如下图所示,完成任务:

目录
相关文章
|
8天前
|
Python Windows
python语法中错误的运算符或分隔符
【5月更文挑战第19天】python语法中错误的运算符或分隔符
15 1
|
9天前
|
IDE 开发工具 C++
|
17天前
20. 有效的括号
20. 有效的括号
21 1
|
22天前
|
存储 编译器 C语言
C++字符串大小写之for语句
C++字符串大小写之for语句
22 0
|
机器学习/深度学习 Shell C++
正则表达式普通字符、非打印字符、特殊字符、限定符的应用、定位符、元字符(规则,匹配,和实际使用)与运算符优先级
正则表达式普通字符、非打印字符、特殊字符、限定符的应用、定位符、元字符(规则,匹配,和实际使用)与运算符优先级
205 0
|
数据安全/隐私保护 Python
一日一技:正则表达式同一个小括号两种意思
一日一技:正则表达式同一个小括号两种意思
162 0
一日一技:正则表达式同一个小括号两种意思
|
存储 数据库 C#
C#语法中一个问号(?)和两个问号(??)的运算符是什么意思?
(1)、C#语法中一个个问号(?)的运算符是指:可以为 null 的类型。  MSDN上面的解释: 在处理数据库和其他包含不可赋值的元素的数据类型时,将 null 赋值给数值类型或布尔型以及日期类型的功能特别有用。
2626 0
20_有效的括号
20_有效的括号
68 0
|
Java 编译器 测试技术
这么简单的三目运算符,竟然这么多坑?(二)
最近在一个业务改造中,使用三目运算符重构了业务代码,没想到测试的时候竟然发生 NPE 的问题。
254 0
这么简单的三目运算符,竟然这么多坑?(二)
|
Java 编译器 程序员
这么简单的三目运算符,竟然这么多坑?(一)
最近在一个业务改造中,使用三目运算符重构了业务代码,没想到测试的时候竟然发生 NPE 的问题。
391 0
这么简单的三目运算符,竟然这么多坑?(一)