python模块:re模块

简介:

.       匹配任意字符
 []      匹配指定字符类别
 ^       字符开头
 $       字符结尾
 [^]     取非字符
 *       重复多次字符(0次或多次)
 +       重复多次字符(1次或多次) 
 ?       重复单次字符
 |       左右表达式任意匹配
 {m,n}   重复m到n次字符
 {m}     重复m次字符  

 \d      匹配任何十进制数,相当于[0-9]
 \D      匹配任何非数字字符,相当于[^0-9]
 \s      匹配任何空白字符,相当于[fdss]
 \S      匹配任何非空白字符,相当于[^jdvnjsd]
 \w      匹配任何数字字母,相当于[a-zA-Z0-9]
 \W      匹配任何非数字字母,相当于[^a-zA-Z0-9]


例1:定义简单的正则表达式

格式:re.compile(strPattern[, flag]): 

strPattern:字符串表达式

flag:

       re.I(re.IGNORECASE): 忽略大小写(括号内是完整写法,下同)

           M(MULTILINE): 多行模式,改变'^'和'$'的行为

           S(DOTALL): 点任意匹配模式,改变'.'的行为

           L(LOCALE): 使预定字符类 \w \W \b \B \s \S 取决于当前区域设定

           U(UNICODE): 使预定字符类 \w \W \b \B \s \S \d \D 取决于unicode定义的字符属性

           X(VERBOSE): 详细模式。这个模式下正则表达式可以是多行,忽略空白字符,并可以加入注释。

pattern=re.compile(r'heLLow',re.I)          #生成一个pattern实例
match=pattern.match('hellow world')    #使用pattern匹配文本

if match:
   print match.group()   #如果匹配就输出


#例2:match属性和方法

#!/bin/env python
#!-*- coding:UTF-8 -*-

import re

match=re.match(r'(\w+)(\w+)(?P<sign>.*)','hellow world!')    #使用pattern匹配文本
print "match.string:",match.string            #匹配时使用的文本
print "match.re:",match.re                    #匹配时使用的pattern对像
print "match.pos:",match.pos                  #开始搜索的索引
print "match.endpos:",match.endpos            #结束搜索的索引
print "match.lastindex:",match.lastindex      #最后一个被捕获在分组在文本中的索引
print "match.lastgroup",match.lastgroup       #最后一个被捕获的分组名
print "match.group(1,2):",match.group(1,2)    #获得一个或多个分组截获的字符串
print "match.groups():",match.groups()        #以元组形式返回全部分组的字符串
print "match.groupdict():",match.groupdict()  #返回有别名组的别名为键
print "match.start(2):",match.start(2)        #返回指定组截获的子串在字符中的起始索引
print "match.end(2):",match.end(2)            #返回指定组截获的子串在字符中的结束索引
print "match.span(2):",match.span(2)          #返回起始组和结束组


#例3:re模块和方法
re.compile            #转换为Pattern对像
re.match              #匹配正零时表达式
re.search             #查找字符串
re.split              #分割字符串
re.findall            #搜索字符中,以列表形式返回全部能匹配的子串
re.finditer           #搜索字符串,返回一个顺序访问每一个匹配的结果
re.sub                #替换字符串
re.subn               #替换字符串,n次

#例4:查找字符串
a=re.compile(r'hello')
b=a.search('hello world')   #查找a中是否有hello字符

if b:
   print b.group()

#例5:截断字符串
p=re.compile(r'\d')
print p.findall('one1two2three3four4five5')

#例6:返回每个匹配的结果
w=re.compile(r'\d')
for m in w.finditer('one1two2three3four4five5'):
    print m.group()

#例7:
e=re.compile(r'(\w+)(\w+)')
s='This is, tong cheng'

print e.sub(r'\2\1',s)
def func(m):
     return m.group(1).title()+ ' ' + m.group(2).title()
print e.sub(func,s)









本文转自 z597011036 51CTO博客,原文链接:http://blog.51cto.com/tongcheng/1764973,如需转载请自行联系原作者
目录
相关文章
|
2月前
|
开发者 Python
如何在Python中管理模块和包的依赖关系?
在实际开发中,通常会结合多种方法来管理模块和包的依赖关系,以确保项目的顺利进行和可维护性。同时,要及时更新和解决依赖冲突等问题,以保证代码的稳定性和可靠性
65 4
|
29天前
|
Python
Python Internet 模块
Python Internet 模块。
121 74
|
2月前
|
算法 数据安全/隐私保护 开发者
马特赛特旋转算法:Python的随机模块背后的力量
马特赛特旋转算法是Python `random`模块的核心,由松本真和西村拓士于1997年提出。它基于线性反馈移位寄存器,具有超长周期和高维均匀性,适用于模拟、密码学等领域。Python中通过设置种子值初始化状态数组,经状态更新和输出提取生成随机数,代码简单高效。
125 63
|
2月前
|
测试技术 Python
手动解决Python模块和包依赖冲突的具体步骤是什么?
需要注意的是,手动解决依赖冲突可能需要一定的时间和经验,并且需要谨慎操作,避免引入新的问题。在实际操作中,还可以结合使用其他方法,如虚拟环境等,来更好地管理和解决依赖冲突😉。
|
8天前
|
Python
[oeasy]python057_如何删除print函数_dunder_builtins_系统内建模块
本文介绍了如何删除Python中的`print`函数,并探讨了系统内建模块`__builtins__`的作用。主要内容包括: 1. **回忆上次内容**:上次提到使用下划线避免命名冲突。 2. **双下划线变量**:解释了双下划线(如`__name__`、`__doc__`、`__builtins__`)是系统定义的标识符,具有特殊含义。
20 3
|
2月前
|
持续交付 Python
如何在Python中自动解决模块和包的依赖冲突?
完全自动解决所有依赖冲突可能并不总是可行,特别是在复杂的项目中。有时候仍然需要人工干预和判断。自动解决的方法主要是提供辅助和便捷,但不能完全替代人工的分析和决策😉。
|
2月前
|
Python
Python的模块和包
总之,模块和包是 Python 编程中非常重要的概念,掌握它们可以帮助我们更好地组织和管理代码,提高开发效率和代码质量
51 5
|
2月前
|
数据可视化 Python
如何在Python中解决模块和包的依赖冲突?
解决模块和包的依赖冲突需要综合运用多种方法,并且需要团队成员的共同努力和协作。通过合理的管理和解决冲突,可以提高项目的稳定性和可扩展性
|
2月前
|
JavaScript 前端开发 Python
python中的OS模块的基本使用
欢迎来到瑞雨溪的博客,一名热爱JavaScript与Vue的大一学生。博客分享前端技术及全栈开发经验,持续更新中,期待您的关注和支持!🎉🎉🎉
45 0
|
2月前
|
JavaScript 前端开发 Python
python中的platform模块的基本使用
欢迎来到瑞雨溪的博客,一名热爱JavaScript与Vue的大一学生。博客分享前端技术,助你成长。关注我,持续更新中!🎉🎉🎉
31 0