正则表达式中的反向预搜索

简介:       这几天在用正则表达式做一个小程序,需要替换内容中的某些特殊字符串。这些字符串的出现是有规律的,那就是在它左面总会特定的内容出现,右面却没有。于是自然就想到了反向预搜索。       在以前的应用,大多是应用正向预搜索情况。

      这几天在用正则表达式做一个小程序,需要替换内容中的某些特殊字符串。这些字符串的出现是有规律的,那就是在它左面总会特定的内容出现,右面却没有。于是自然就想到了反向预搜索。

      在以前的应用,大多是应用正向预搜索情况。也就是说,在查找内容的右面有特定的内容限定,例如下面的例子:

var str3 = 'CPU: Intel Core2 5200; Memory: 2G;OS: Ubuntu 9.04'; var reg3 = /Memory/:/s+(.*(?=/;OS/:))/gim; str3.match(reg3); alert(RegExp.$1); //结果是2G

     (.*(?=/;OS/:) 就是典型的正向预搜索,只有右面内容是“;OS: ”才会被匹配到。

 

     但是现在要实现的效果,左面的内容是固定,而不是右面。可是JavaScript并不支持反向预搜索。我相信,细心的朋友已经发现了,其实上面的例子已经达到了这个目的(前面的Memory/:/s+ 限定了左面的内容)。下面再给出一个例子:

      //程序目的,去掉图片路径中的域名 var str = '<img src="http://news.163.com/sports/yao.jpg" >'; var reg1 = /(/<img)(.*(?=(http|https)/:////))((http|https)/:////[^//]*)/gim; str.match(reg1); alert(str.replace(RegExp.$4,''));

 

      那么到底有没有反向预搜索呢?答案是肯定的,可是现实是残酷的。我查阅了一些资料,上面提到反向预搜索的形式是以?<= 或者?<! 为引导的。遗憾的是JavaScript并不支持,在高版本的Java中已获支持,于是就编写了下面的测试程序(JRE1.6.0_03):

import java.util.regex.Matcher; import java.util.regex.Pattern; public class RegExpTest { public static void main(String[] args){ Pattern p = Pattern.compile("((?<=//<img.*(?=(http|https)))(http|https))"); Matcher matcher = p.matcher("<img src="http://news.163.com/sports/yao.jpg"/>"); System.out.println(matcher.matches()); } }

    程序本身应该没有什么问题,但是运行结果:

Exception in thread "main" java.util.regex.PatternSyntaxException: Look-behind group does not have an obvious maximum length near index 27
((?<=/<img.*(?=(http|https)))(http|https))

 

     我Google了半天,最后得到的唯一结果就是换种写法。希望看到这篇文章的朋友,如果已经实现了这种效果,一定要留言不吝赐教。

 

     另外,在我看文档时看到了?:引导的正则表达式,上面说是“匹配不存储”,百思不得其解。感觉还是代码来的实在,写一个看一下:

     var str2 = '客户端名称'; var reg2 = /(客户端名(?:称)?)/; str2.match(reg2); alert(RegExp.1);//alert(RegExp.2); //空字符串 //不使用?: reg2 = /(客户端名(称)?)/; str2.match(reg2); alert(RegExp.1);//alert(RegExp.2); //称

 

     敏捷开发思想说:代码是最好的文档。给了我借口,呵呵。

目录
打赏
0
0
0
0
6
分享
相关文章
Mysql基础第十二天,用正则表达式进行搜索
Mysql基础第十二天,用正则表达式进行搜索
73 0
Mysql基础第十二天,用正则表达式进行搜索
【专栏】`ripgrep`(rg)是Linux下快速、内存高效的文本搜索工具,用Rust编写,支持PCRE2正则表达式
【4月更文挑战第28天】`ripgrep`(rg)是Linux下快速、内存高效的文本搜索工具,用Rust编写,支持PCRE2正则表达式。相比`grep`,它在处理大文件和复杂模式时更具优势。安装`rg`可通过软件包管理器,如在Debian系系统中使用`sudo apt install ripgrep`。基本用法包括简单搜索、递归搜索、忽略大小写、显示行号等。高级功能包括固定字符串搜索、多文件匹配、并行搜索、排除选项和区域搜索。适用于日志分析、代码审查等场景,是提升工作效率的利器。
873 4
|
10月前
|
JavaSE——正则表达式(2/2):应用案例、查找信息、用于搜索替换、分割内容
JavaSE——正则表达式(2/2):应用案例、查找信息、用于搜索替换、分割内容
41 0
|
11月前
|
grep正则表达式搜索
grep正则表达式搜索
81 3
|
11月前
|
正则表达式源码分析--三个常用类--分组、捕获、反向引用--String 类中使用正则表达式的代码示例和图
正则表达式源码分析--三个常用类--分组、捕获、反向引用--String 类中使用正则表达式的代码示例和图
117 0
Java 正则表达式【非贪婪匹配、格式验证、反向引用、API】
Java 正则表达式【非贪婪匹配、格式验证、反向引用、API】
AI助理

你好,我是AI助理

可以解答问题、推荐解决方案等