除了前面介绍的"^“和”$"之外,表达式里还有还有许多元字符,今天我们就继续来看看这些元字符所代表的意思。
前言
在处理正字符串的时候,经常会有一些复杂规则的字符串需求,
正则表表达式就是描述这些规则的公工具。
换句话说
正则表达式就是记录文本规则的代码。
行定位符部分请参考:
为什么要学正则表达式 - 1
元字符
\n匹配换行符。 \t匹配制表符。 \w匹配字母、数字、下划线。 \W匹配除了字母、数字、下划线的字符串。字母大写相当于非(个人总结) \d匹配十进制数字 \D匹配除了十进制数字的字符串 \s匹配空白字符 \S匹配非空白字符 \b匹配单词的开始或结束,单词的分界通常是空格、标点符号或者换行
接下来我们来看一组\b的实例
def match_str(string): regex_str = "\\bapple\\b" #匹配规则 match_regex = re.match(regex_str, string) if match_regex: print('match!') else: print('not match') if __name__ == '__main__': match_str('apple') #进行匹配的字符串 #match
上面这组表达式有什么含义呢?
\b匹配apple开头的单词,最后是单词结尾(\b)。
注意\b匹配的是位置,而不是任意字符,匹配的是单词的边界。
接下来我们再看一看\s的具体含义。请看以下实例
def match_str(string): regex_str = 'six\s*students' #匹配规则 match_regex = re.match(regex_str, string) if match_regex: print('match!') else: print('not match') if __name__ == '__main__': match_str('six students') #进行匹配的字符串 #match
上面这组表达式有什么含义呢?
使用\s去匹配空白字符,如果含有多个空白字符的话需要使用使用\s*匹配。
刚才演示了一下\s的意思。接下来我们再看一看\S的具体含义。请看以下实例
String = 'six+-*/students' regex_str = 'six\S*students' match_str = re.match(regex_str, String) if match_str: print('match!') else: print('Not match!') #match
这个表达式的意思很简单,除了空格之外的所有都可以匹配得到。
好了,今天分享到此结束。明天咱们继续!