巧解正则表达式环视

简介:

正则表达式匹配主要有两种,匹配字符和匹配位置。环视我个人理解应该更像是匹配位置的。具体下文说到。下面先看一下环视的正则表达式书写格式。

类型 正则表达式 匹配成功条件
肯定逆序环视 (?<=expresion) 子表达式能够匹配左侧文本
否定逆序环视 (?<!expresion) 子表达式不能匹配左侧文本
肯定顺序环视 (?=expresion) 子表达式能够匹配右侧文本
否定顺序环视 (?!expresion) 字表达式不能匹配右侧文本

 

 

 

 

本表摘自《精通正则表达式》p66

 

你要是觉得我会按照上面的表格来理解你就错了,看完上面的表格我是一脸懵逼的,用的时候更加会一脸懵逼,然后把书本中p66页前面的几页再翻了几遍,发现一段很重要的话,顺序环视会检查子表达式能否匹配,但它只寻找能够匹配的位置,而不会真正“占用”这些字符。好了,大家赶紧画重点,考试要考,它只寻找能够匹配的位置,也就是说环视只是匹配位置,而不是匹配文本,匹配位置最常见的就是^和$,指匹配文本的开头和结尾,然后把上面的表格再转换一下就是

 

类型 正则表达式 匹配成功条件
肯定逆序环视 (?<=expresion) 匹配子表达式右侧的位置
否定逆序环视 (?<!expresion) 匹配非子表达式右侧的位置
肯定顺序环视 (?=expresion) 匹配子表达式左侧的位置
否定顺序环视 (?!expresion) 匹配非子表达式左侧的位置

 

 

 

 

 

 单单看这个表还是有点一脸懵逼,那就来举几个栗子。玩正则表达式推荐你们一个利器,简直能称为神器,RegexBuddy,是《精通正则表达式》中介绍的。下面的例子我都是用他来完成。

1、(?=\d)

可以理解为匹配数字左边的位置,然后把匹配到的位置替换为逗号,结果如图,图中左上角为正则表达式和替换字符串,右下角为匹配的文本和替换的结果

看图中右下角高亮的逗号,就是之前的匹配的位置。

2、(?!\b)

匹配非数字左边的位置,然后把这些匹配的位置替换为逗号,结果如图

 对比1和2的两个图你就会发现(?=\b)和(?!\b)是互补的关系,两个表达式匹配的位置合起来就是该匹配的文本的所有位置。

3、书中例子完善

《精通正则表达式》书中环视用了一个例子来贯通。该例子也比较常用,就是对于比较大的数值,我们一般在其中间加入逗号,这样才能更容易看懂,如112347915如果写成112,347,915就会比较清晰一点。

下面我将一步步说明如何把“今年的营业额为112347915.5465万元”替换为“今年的营业额为112,347,915.5465万元”

a、要替换的位置在数字的左边

正则表达式:(?=\d)

替换结果:今年的营业额为,1,1,2,3,4,7,9,1,5.,5,4,6,5万元

b、要替换的位置右边至少有三个数字,也就是位置是在三个数字左边

正则表达式:(?=\d\d\d)

替换结果:今年的营业额为,1,1,2,3,4,7,915.,5,465万元

c、要匹配的位置左边应该有数字,也就是该位置应该是在数字的右边

正则表达式:(?<=\d)(?=\d\d\d)

替换结果:今年的营业额为1,1,2,3,4,7,915.5,465万元

d、匹配位置的时候需要没隔三个数字进行匹配,这时候就要用到量词"+"了

正则表达式:(?<=\d)(?=(\d\d\d)+(?!\d))

替换结果:今年的营业额为112,347,915.5,465万元

其中(?=(\d\d\d)+(?!\d))的意思就是指匹配一个位置,该位置是在(\d\d\d)+(?!\d)的左边,也就是该位置是在一个非数字的左边的每三个数字的左边(囧,有点绕口)。

e、最后排除掉小数点后面的位置,也就是匹配的位置不能是在小数点之后的连续数字中。

正则表达式:(?<=\d)(?<!\.\d+)(?=(\d\d\d)+(?!\d))

替换结果:今年的营业额为112,347,915.5465万元

本文转自帅气的头头博客51CTO博客,原文链接http://blog.51cto.com/12902932/1949368如需转载请自行联系原作者


sshpp

相关文章
|
6月前
|
监控 算法 数据安全/隐私保护
唯品会 item_get - 获得 VIP 商品详情接口深度分析及 Python 实现
唯品会item_get接口通过商品ID获取商品详情,支持价格、库存、促销等数据抓取,适用于电商分析、竞品监控与价格追踪,结合Python实现可高效完成数据获取、分析与可视化,助力精准营销决策。
|
6月前
|
数据采集 存储 XML
Python爬虫技术:从基础到实战的完整教程
最后强调: 父母法律法规限制下进行网络抓取活动; 不得侵犯他人版权隐私利益; 同时也要注意个人安全防止泄露敏感信息.
920 19
|
6月前
|
小程序 PHP 图形学
热门小游戏源码(Python+PHP)下载-微信小程序游戏源码Unity发实战指南​
本文详解如何结合Python、PHP与Unity开发并部署小游戏至微信小程序。涵盖技术选型、Pygame实战、PHP后端对接、Unity转换适配及性能优化,提供从原型到发布的完整指南,助力开发者快速上手并发布游戏。
|
设计模式 安全 Java
Java 多线程并发编程
Java多线程并发编程是指在Java程序中使用多个线程同时执行,以提高程序的运行效率和响应速度。通过合理管理和调度线程,可以充分利用多核处理器资源,实现高效的任务处理。本内容将介绍Java多线程的基础概念、实现方式及常见问题解决方法。
455 1
|
存储 数据采集 前端开发
Node.js----前后端的身份认证(session与jwt)(一)
Node.js----前后端的身份认证(session与jwt)
|
开发框架 安全 .NET
使用grpcui测试gRPC服务
使用grpcui测试gRPC服务
421 0
|
搜索推荐 安全 网络安全
Discuz! X3.5自带参数防御CC攻击以及原理、开启防CC攻击后不影响搜索引擎收录的方法
Discuz! X3.5自带参数防御CC攻击以及原理、开启防CC攻击后不影响搜索引擎收录的方法
849 2
|
JavaScript 前端开发 API
Vue.js与Angular的优劣分析
Vue.js和Angular都是非常流行的JavaScript框架,它们在构建现代Web应用程序方面各有优劣
428 64
|
存储 监控 安全
警用装备管理系统框架图
警用装备管理系统采用多层架构,包括感知层实时采集装备信息,网络层安全传输数据,接入层支持设备互联,数据层存储管理装备详情,业务层处理核心操作如出入库、调拨等,应用层提供用户界面操作,展示层以图表等形式展现数据分析结果,辅助决策。
300 0
|
安全 IDE 编译器
深入理解PHP 7的新特性及其对现代Web开发的影响
【7月更文挑战第30天】本文将深入探索PHP 7版本中引入的关键新特性,并分析这些改进如何优化现代Web开发实践。通过对比PHP 5和PHP 7的性能差异,我们将揭示PHP 7如何提升应用响应速度和资源利用效率。此外,本文还将讨论PHP 7对开发者工作流程的影响,包括新的语言特性、错误处理机制以及内置函数的增强,旨在为读者提供全面了解PHP 7所带来的变革性影响。

热门文章

最新文章