正则表达式-不包含某个字符串

简介:

     在使用正则表达式的场合,常常有这种需求,就是匹配一个不包含某个子串的子符串。比如说,我要从“eabcdfgh”得到"cd"之前的子串。有些人可能会写:

([^cd]*)

这种写法是彻底错误的,因为[]中的是集合,也就是说,[^cd]表示不等于c或者d,而不是cd。下面的程序中没有cd,但eab还是被匹配出来了。

 
  1. String s = "([^cd]*)"
  2. Match m = Regex.Match("eabcfgh", s); 
  3. MessageBox.Show(m.Value);//eab 
  4. MessageBox.Show(m.Groups[1].Value);//eab 

上面这种写法是错的比较离谱的,正常青年一般都可以避免这种错误。在特殊情况下,正则表达式可以这么写,而且效率是比较高的。

([/s/S]*cd)

先说明下/s/S是表示匹配任何字符。所谓特殊情况,就是我知道这个字符串中必有cd的存在。假如,我的要求是匹配不包含cd的部分(为了描述方便,只匹配cd之前的部分),也就是说,当cd不存在时,应该把整个字符串都取出来。

 
  1. String s = "((.(?!cd))*.)"
  2. //String s = "([/s/S]*cd)"; 
  3. Match m = Regex.Match("eabcdfgh", s); 
  4. MessageBox.Show(m.Value);//eab 
  5. MessageBox.Show(m.Groups[1].Value);//eab 

这种写法终于符合要求了。不过值得一提的是,相较前一种而言,它的效率比较低。

回顾一下相关的语法:

(?:子表达式)         定义非捕获组。

 
  1. //定义非捕获组 
  2. String s = "e(?:ab)(.*)"
  3. Match m = Regex.Match("eabcd", s); 
  4. MessageBox.Show(m.Value);//eabcd 
  5. MessageBox.Show(m.Groups[1].Value);//cd 

ab是被匹配的,但是它所在的组没有被捕获,Group[1]是cd

(?=子表达式)       零宽度正预测先行断言。

 
  1. //零宽度正预测先行断言 
  2. //String s = "b(cd|de)(.*)"; 
  3. String s = "b(?=cd|de)(.*)"
  4. Match m = Regex.Match("eabcdfg", s); 
  5. MessageBox.Show(m.Value); 
  6. MessageBox.Show(m.Groups[1].Value);//区别 cd  cdfg 

这种写法和注释掉的写法是有区别的,区别就是“零宽度”,这种写法会被捕获,也就是不占一个Group。

(?!子表达式)       零宽度负预测先行断言。

!表示非,就是不包含,同样是零宽度,不会被捕获。

 

(?<=子表达式)    零宽度正回顾后发断言。

例:(?<=19)\d{2}\b

“1851 1999 1950 1905 2003”中的“99”、“50”和“05”

(?<!子表达式)     零宽度负回顾后发断言。

例:(?<!19)\d{2}\b

“1851 1999 1950 1905 2003”中的“51”和“03”




本文转自 dogegg250 51CTO博客,原文链接:http://blog.51cto.com/jianshusoft/766007,如需转载请自行联系原作者

相关文章
|
6月前
|
JavaScript 前端开发 Java
正则表达式深度解析:匹配任意字符串
【4月更文挑战第1天】
3350 0
|
6月前
|
JavaScript 前端开发
用JavaScript正则表达式匹配对应字符串高亮显示,并过滤掉空格、<、>等HTML节点符号
用JavaScript正则表达式匹配对应字符串高亮显示,并过滤掉空格、<、>等HTML节点符号
|
1月前
|
JavaScript 前端开发 Java
如何使用这个正则表达式来验证一个字符串是否符合特定的格式要求?
如何使用这个正则表达式来验证一个字符串是否符合特定的格式要求?
|
1月前
|
Java API 索引
U4字符串以及正则表达式
【10月更文挑战第19天】在 Java 中,字符串是重要数据类型,支持多种操作如长度获取、字符访问、子串提取等。正则表达式提供强大的模式匹配和文本处理功能,通过 `Pattern` 和 `Matcher` 类实现。示例代码展示了如何使用正则表达式匹配单词字符。常用语法包括字符类、数量词、边界匹配和分组。
|
2月前
|
JavaScript 前端开发 Java
使用这个正则表达式来验证一个字符串是否符合特定的格式要求
使用这个正则表达式来验证一个字符串是否符合特定的格式要求
136 5
|
2月前
|
前端开发 C#
C# 一分钟浅谈:字符串操作与正则表达式
本文详细介绍C#中的字符串操作与正则表达式应用,涵盖字符串拼接、分割、查找及替换等基础操作,并通过实例讲解正则表达式的模式匹配、文本替换与分组捕获技巧。同时,文章还探讨了性能优化、复杂度管理和安全性等问题及解决策略,助你提升编程效率,应对实际开发挑战。
77 0
如何根据文件夹中文件,生成对应名字的图片,名称一样的路径,这里用到了变量,将集合定义在外面,字符串拼接,正则表达式截取.jpg文件
如何根据文件夹中文件,生成对应名字的图片,名称一样的路径,这里用到了变量,将集合定义在外面,字符串拼接,正则表达式截取.jpg文件
|
5月前
|
Python
Python使用正则表达式分割字符串
在Python中,你可以使用re模块的split()函数来根据正则表达式分割字符串。这个函数的工作原理类似于Python内置的str.split()方法,但它允许你使用正则表达式作为分隔符。
|
5月前
|
数据采集 Java 开发者
正则表达式替换字符串的最佳实践与应用
正则表达式替换字符串的最佳实践与应用
|
6月前
|
数据挖掘 程序员 索引
探索Python的字符串操作和正则表达式
【4月更文挑战第8天】Python以其优雅的语法和强大的文本处理能力,让处理文本数据变得简单有趣。本文介绍了字符串操作和正则表达式的应用。在Python中,字符串是字符序列,支持拼接、索引和切片。正则表达式则提供灵活的模式匹配,用于查找、替换和分割文本。通过`re`模拝,我们可以实现对特定模式的精准匹配,如查找不分大小写的&quot;Python&quot;,或替换电子邮件地址为星号。学习和掌握这些工具,将使你在文本处理任务中更加高效,成为信息时代的艺术家。
32 1