glob,正则表达式元字符,扩展正则表达式总结

简介:
globbing: 文件名通配
    查询详细信息: man glob

    元字符:
        *: 匹配任意长度的任意字符
        ?: 匹配任意单个字符
        []: 匹配指定范围内的任意单个字符
        [^]: 匹配指定范围外的任意单个字符

        有几种特殊格式:
            [a-z],[0-9],[a-zA-Z],[a-z0-9]
            [[:upper:]]: 所有大写字母
            [[:lower:]]: 所有小写字母
            [[:alpha:]]: 所有字母
            [[:digit:]]: 所有数字
            [[:alnum:]]: 所有的字母和数字
            [[:blank:]]: 包含空格和tab
            [[:space:]]: 所有空白字符(blank+换行符)
            [[:punct:]]: 所有标点符号
基本正则表达式的元字符:
        字符匹配:
            .   : 匹配任意单个字符
            []  : 匹配指定范围内的任意单个字符
            [^] : 匹配指定范围外的任意单个字符
                如:
                    [:upper:]、[:lower:]、[:alpha:]、[:digit:]、[:alnum:]、[:punct:]、[:space:]...
        次数匹配:
            *  : 匹配其前面的字符任意次;可为0次;
            \? : 匹配其前面的字符1次或0次;
            \+ : 匹配其前面的字符至少1次;
            \{n\}: 匹配其前面的字符n次;
            \{m,\}: 匹配其前面的字符至少m次;
            \{m,n\}: 匹配其前面的字符至少m次,至多n次;
            \{0,n\}: 匹配前面的字符至少0次,至多n次;

        位置锚定:
            ^ : 行首锚定; 用于模式的最左侧;
            $ : 行尾锚定; 用于模式的最右侧;
            \< 或 \b : 词首锚定; 用于单词模式的左侧;
            \> 或 \b : 词尾锚定; 用于单词模式的右侧;

            ^PATTERN$: 用于PATTERN来匹配整行;
                ^$: 空白行;
                ^[[:space:]]*$: 空白行或包含空白字符的行;
            单词: 非特殊字符组成的连续字符(字符串)都称为单词;

        分组及引用:
            \(\): 将一个或多个字符捆绑在一起,当作一个整体进行处理;

                分组括号中的模式匹配到的内容会被正则表达式引擎自动记录于内部的变量中,这些变量为:
                    \1: 模式从左侧起,第一个左括号以及与之匹配的右括号之间的模式所匹配到的字符;
                    \2: 模式从左侧起,第二个左括号以及与之匹配的右括号之间的模式所匹配到的字符;
                    以此类推
                    ...

                后向引用: 引用前面的分组括号中的模式所匹配到的字符;使用以上变量进行调用;

        或:
            \| : PATTERN1或者PATTERN2;
扩展正则表达式的元字符:  (扩展基于标准正则,符号简化)
 

            |



本文转自 撒旦搞时间 51CTO博客,原文链接:http://blog.51cto.com/12074120/1963880,如需转载请自行联系原作者

相关文章
|
Java
避免分割字符串的常见错误:正则表达式元字符未转义
在编程和文本处理中,我们经常需要将一个字符串按照特定的分隔符拆分成多个部分。为了实现这一目标,我们使用分割函数或正则表达式来定义我们所需的分隔符。 在 Java 的 String 类的 split() 函数中,如果你使用字符串参数作为分隔符,例如 split(","),它会按照每个字符作为分隔符进行字符串拆分。
89 0
|
机器学习/深度学习 Java Unix
最详解的正则表达式------元字符
正则表达式是通过一些特殊字符的排列,用以查找、替换、删除一行或多行文字字符串,简单的说,正则表达式就是用在字符串的处理上面的一项表示式。由于正则表达式语法简练,功能强大,得到了许多 程序设计语言的支持,包括Java、C++、Perl以及Shell等。
114 0
|
机器学习/深度学习 移动开发 前端开发
Sublime Text3快捷键大全--正则表达式元字符-详细说明
Sublime Text3快捷键大全--正则表达式元字符-详细说明
247 0
正则表达式重复元字符
正则表达式重复元字符
123 0
|
机器学习/深度学习 Shell C++
正则表达式普通字符、非打印字符、特殊字符、限定符的应用、定位符、元字符(规则,匹配,和实际使用)与运算符优先级
正则表达式普通字符、非打印字符、特殊字符、限定符的应用、定位符、元字符(规则,匹配,和实际使用)与运算符优先级
256 0
|
机器学习/深度学习
正则表达式(一):常用元字符
正则是什么 正则表达式是一种字符串模式,用来对某些规则的文本内容进行处理。利用字符串构成成的数据结构,来完成对文本内容的匹配。 经常可以看到正则表达式的句子里包含了一些\d、\w和()之类的符号,这些特殊格式的符号可以看做正则结构中的元素,这些符号也成之为元字符,下面介绍下这些元字符的作用。
1097 0
|
Linux 开发工具 开发者
扩展正则表达式 | 学习笔记
快速学习扩展正则表达式。
164 0