正则表达式
正则表达式(regular expression)是可以匹配文本片段的模式。最简单的正则表达式就是普通字符串,可以匹配其自身。比如,正则表达式 ‘hello’ 可以匹配字符串 ‘hello’。
如果刚开始看不懂,下面可以通过实例来看看:
1.匹配 python.org 的正则表达式:
python\.org
注:如果使用 python.org 来匹配,由于 . 可以匹配任意一个字符(换行符除外),因此,它也会匹配到类似 pythonmorg 的字符串,为了匹配点号,我们需要加 \ 来转义。
2.匹配由数字、26个英文字母或下划线组成的字符串的正则表达式:
^\w+$
注:\d 表示匹配数字,\d{3} 表示匹配 3 个数字,- 表示匹配 -。
3.匹配由数字、26个英文字母或下划线组成的字符串的正则表达式:
^\w+$
或
^[0-9a-zA-Z_]+$
4.匹配 13、15、18 开头的手机号的正则表达式:
^(13[0-9]|15[0|1|2|3|5|6|7|8|9]|18[0-9])\d{8}$
5.匹配金额,精确到 2 位小数:
^[0-9]+(.[0-9]{2})?$
6.匹配中文的正则表达式:
^[\u4e00-\u9fa5]{0,}$
通过这些实例可以看出来,正则表达式其实是一些语句的抽象,具有相同格式的语句可以用同一正则表达式代表
要注意的是,正则表达式并不是一个程序,而是用于处理字符串的一种模式,如果你想用它来处理字符串,就必须使用支持正则表达式的工具,比如 Linux 中的 awk, sed, grep,或者编程语言 Perl, Python, Java 等。
下图列出了Python支持的正则表达式元字符和语法:
AIEarth是一个由众多领域内专家博主共同打造的学术平台,旨在建设一个拥抱智慧未来的学术殿堂!【平台地址:https://devpress.csdn.net/aiearth】 很高兴认识你!加入我们共同进步!