PythonStudyNotes---正则表达式

简介: 正则表达式:一种用来匹配字符串的工具,根据不同类型的字符串,有不同的描述性语言来定义。以下是部分描述性语言对应的匹配类型:精确匹配:\w:匹配一个字母或数字(word);\d:匹配一个数字(digit);.

正则表达式:一种用来匹配字符串的工具,根据不同类型的字符串,有不同的描述性语言来定义。

以下是部分描述性语言对应的匹配类型:

精确匹配:
\w:匹配一个字母或数字(word);
\d:匹配一个数字(digit);
.:匹配任意字符;
\s:匹配一个空格,也包括tab等空白符;

如要匹配多个字符,在后面加如下代码:
*:表示任意个字符(包括0个)
+:表示至少一个字符
?:表示0个或1个字符
{n}:表示n个字符
{n,m}:表示n--m个字符

例:匹配```'123-963210'```类型的电话号
A :```\d{3}\-\d{6}```  其中因为```-```是特殊字符,所以用```\```进行转义

[ ]的运用,可以用来表示范围,比如:

  • [0-9a-zA-Z\_]可以匹配一个数字0-9、一个字母a-zA-Z或者下划线\_

  • [0-9a-zA-Z\_]+可以匹配至少由一个数字、字母或者下划线组成的字符串,比如'nba2k','d_j','98k'等等;

  • [a-zA-Z\_][0-9a-zA-Z\_]*可以匹配由字母或下划线开头,后接任意个由一个数字、字母或者下划线组成的字符串,也就是Python合法的变量;

  • [a-zA-Z\_][0-9a-zA-Z\_]{0, 10}更精确地限制了变量的长度是1-11个字符(前面1个字符+后面最多10个字符)。

  • A|B可以匹配A或B,所以(M|m)ark可以匹配Markmark

  • ^表示行的开头,^\d表示以数字开头
    $表示行的结尾,\d$表示以数字结尾
    当想要匹配以A开头,以B结尾的字符串时,可以用^A*B$\

注意:python字符串中的特殊符号要用\进行转义。
要输出'aa\bb' --- 'aa\bb'=>'aa�bb' ;'aa\bb'=>'aa\bb' ;

re模块的运用

img_88ea51776f1a842769d295e6ac517285.png
三个函数的运用

split(分割):

# 以s为界分割字符串
import re      # 调用re模块
a = ('boysgirlsgreat')
b = re.split(r's', a)
print(b)
# ['boy', 'girl', 'great']

compile(可以实现更有效率的匹配,因为使用compile完成一次转换之后,在每次使用模式的时候就不用重复转换,从而提高效率):

# 举一个简单的例子,在寻找一个字符串中所有的英文字符:
import re
pattern = re.compile('[a-zA-Z]')
result = pattern.findall('as3SiOPdj#@23awe')
print result
# ['a', 's', 'S', 'i', 'O', 'P', 'd', 'j', 'a', 'w', 'e']

findall(寻找所有符合条件的字符):

# 找出所有的数字
import re
a = re.compile('\d')
b = a.findall('sd2esds43asd')
print(b)
# ['2', '4', '3']

总结参考1

目录
相关文章
|
6月前
|
Linux Perl
sed删除匹配正则表达式的行
sed删除匹配正则表达式的行
343 1
匹配中文字符的正则表达式: [/u4e00-/u9fa5]
原文:匹配中文字符的正则表达式: [/u4e00-/u9fa5] 这里是几个主要非英文语系字符范围(google上找到的): 2E80~33FFh:中日韩符号区。收容康熙字典部首、中日韩辅助部首、注音符号、日本假名、韩文音符,中日韩的符号、标点、带圈或带括符文数字、月份,以及日本的假名组合、单位、年号、月份、日期、时间等。
2337 0
正则表达式的常用示例
正则表达式的常用示例
|
4月前
|
数据采集 Java 数据处理
正则表达式替换技巧与实用案例分享
正则表达式替换技巧与实用案例分享
|
5月前
|
数据采集
正则表达式替换
正则表达式替换
|
6月前
|
人工智能 JavaScript
js正则表达式new RegExp(表达式, “gi“)不区分大小写、忽略大小写匹配替换字符
js正则表达式new RegExp(表达式, “gi“)不区分大小写、忽略大小写匹配替换字符
正则表达式的用法
正则表达式的用法
69 1
C#编程-87:正则表达式替换
C#编程-87:正则表达式替换
C#编程-87:正则表达式替换
|
Scala
scala正则表达式获取匹配到的字符串
正则表达式获取匹配到的字符串 //需要匹配出来的地方用括号括起来 val pattern="""(.*)\[(.*)\]""".r //新建一个正则表达式 val pattern(ele,str)="fff[ascdrewr]" println(s"$ele,$str") 这样有个问题,当匹配不到会抛异常 image.
2608 0
|
机器学习/深度学习 移动开发 前端开发
关于正则表达式的使用的一些小示例
关于正则表达式的使用的一些小示例
82 0