巧解正则表达式环视

简介:

正则表达式匹配主要有两种,匹配字符和匹配位置。环视我个人理解应该更像是匹配位置的。具体下文说到。下面先看一下环视的正则表达式书写格式。

类型 正则表达式 匹配成功条件
肯定逆序环视 (?<=expresion) 子表达式能够匹配左侧文本
否定逆序环视 (?<!expresion) 子表达式不能匹配左侧文本
肯定顺序环视 (?=expresion) 子表达式能够匹配右侧文本
否定顺序环视 (?!expresion) 字表达式不能匹配右侧文本

 

 

 

 

本表摘自《精通正则表达式》p66

 

你要是觉得我会按照上面的表格来理解你就错了,看完上面的表格我是一脸懵逼的,用的时候更加会一脸懵逼,然后把书本中p66页前面的几页再翻了几遍,发现一段很重要的话,顺序环视会检查子表达式能否匹配,但它只寻找能够匹配的位置,而不会真正“占用”这些字符。好了,大家赶紧画重点,考试要考,它只寻找能够匹配的位置,也就是说环视只是匹配位置,而不是匹配文本,匹配位置最常见的就是^和$,指匹配文本的开头和结尾,然后把上面的表格再转换一下就是

 

类型 正则表达式 匹配成功条件
肯定逆序环视 (?<=expresion) 匹配子表达式右侧的位置
否定逆序环视 (?<!expresion) 匹配非子表达式右侧的位置
肯定顺序环视 (?=expresion) 匹配子表达式左侧的位置
否定顺序环视 (?!expresion) 匹配非子表达式左侧的位置

 

 

 

 

 

 单单看这个表还是有点一脸懵逼,那就来举几个栗子。玩正则表达式推荐你们一个利器,简直能称为神器,RegexBuddy,是《精通正则表达式》中介绍的。下面的例子我都是用他来完成。

1、(?=\d)

可以理解为匹配数字左边的位置,然后把匹配到的位置替换为逗号,结果如图,图中左上角为正则表达式和替换字符串,右下角为匹配的文本和替换的结果

看图中右下角高亮的逗号,就是之前的匹配的位置。

2、(?!\b)

匹配非数字左边的位置,然后把这些匹配的位置替换为逗号,结果如图

 对比1和2的两个图你就会发现(?=\b)和(?!\b)是互补的关系,两个表达式匹配的位置合起来就是该匹配的文本的所有位置。

3、书中例子完善

《精通正则表达式》书中环视用了一个例子来贯通。该例子也比较常用,就是对于比较大的数值,我们一般在其中间加入逗号,这样才能更容易看懂,如112347915如果写成112,347,915就会比较清晰一点。

下面我将一步步说明如何把“今年的营业额为112347915.5465万元”替换为“今年的营业额为112,347,915.5465万元”

a、要替换的位置在数字的左边

正则表达式:(?=\d)

替换结果:今年的营业额为,1,1,2,3,4,7,9,1,5.,5,4,6,5万元

b、要替换的位置右边至少有三个数字,也就是位置是在三个数字左边

正则表达式:(?=\d\d\d)

替换结果:今年的营业额为,1,1,2,3,4,7,915.,5,465万元

c、要匹配的位置左边应该有数字,也就是该位置应该是在数字的右边

正则表达式:(?<=\d)(?=\d\d\d)

替换结果:今年的营业额为1,1,2,3,4,7,915.5,465万元

d、匹配位置的时候需要没隔三个数字进行匹配,这时候就要用到量词"+"了

正则表达式:(?<=\d)(?=(\d\d\d)+(?!\d))

替换结果:今年的营业额为112,347,915.5,465万元

其中(?=(\d\d\d)+(?!\d))的意思就是指匹配一个位置,该位置是在(\d\d\d)+(?!\d)的左边,也就是该位置是在一个非数字的左边的每三个数字的左边(囧,有点绕口)。

e、最后排除掉小数点后面的位置,也就是匹配的位置不能是在小数点之后的连续数字中。

正则表达式:(?<=\d)(?<!\.\d+)(?=(\d\d\d)+(?!\d))

替换结果:今年的营业额为112,347,915.5465万元




本文转自 sshpp 51CTO博客,原文链接:http://blog.51cto.com/12902932/1949368,如需转载请自行联系原作者
相关文章
全网最易懂的正则表达式教程(7)- 环视
全网最易懂的正则表达式教程(7)- 环视
140 0
全网最易懂的正则表达式教程(7)- 环视
Python 内置正则表达式库re的使用
正则表达式是记录文本规则的代码,用于查找和处理符合特定规则的字符串。在Python中,常通过原生字符串`r&#39;string&#39;`表示。使用`re.compile()`创建正则对象,便于多次使用。匹配字符串有`match()`(从开头匹配)、`search()`(搜索首个匹配)和`findall()`(找所有匹配)。替换字符串用`sub()`,分割字符串则用`split()`。
|
6月前
|
数据库 Python
Python网络数据抓取(8):正则表达式
Python网络数据抓取(8):正则表达式
64 2
|
6月前
|
自然语言处理 JavaScript 前端开发
Python高级语法与正则表达式(二)
正则表达式描述了一种字符串匹配的模式,可以用来检查一个串是否含有某种子串、将匹配的子串做替换或者从某个串中取出符合某个条件的子串等。
|
6月前
|
安全 算法 Python
Python高级语法与正则表达式(一)
Python提供了 with 语句的写法,既简单又安全。 文件操作的时候使用with语句可以自动调用关闭文件操作,即使出现异常也会自动关闭文件操作。
|
6月前
|
Python
Python使用正则表达式分割字符串
在Python中,你可以使用re模块的split()函数来根据正则表达式分割字符串。这个函数的工作原理类似于Python内置的str.split()方法,但它允许你使用正则表达式作为分隔符。
|
6月前
|
Python
Python中re模块的正则表达式
【6月更文挑战第2天】了解Python的re模块,它是处理正则表达式的核心工具。正则表达式用于在文本中查找特定模式。本文讨论了re模块的用法和技巧,包括导入模块、匹配、分组、替换文本、编译正则表达式以及使用预定义字符类、量词、锚点等高级功能。通过实例展示了如何在Python中执行这些操作,帮助提升文本处理能力。掌握这些技巧将使你更有效地利用正则表达式解决字符串处理问题。
64 2
|
6月前
|
Python
Python正则表达式详解:掌握文本匹配的魔法
Python正则表达式详解:掌握文本匹配的魔法
|
6月前
|
Python
python re 正则表达式库的使用
python re 正则表达式库的使用
49 0
|
7月前
|
数据安全/隐私保护 Python
Python进阶---正则表达式
Python进阶---正则表达式
30 2