开发者社区> 技术小阿哥> 正文

glob,正则表达式元字符,扩展正则表达式总结

简介:
+关注继续查看
globbing: 文件名通配
    查询详细信息: man glob

    元字符:
        *: 匹配任意长度的任意字符
        ?: 匹配任意单个字符
        []: 匹配指定范围内的任意单个字符
        [^]: 匹配指定范围外的任意单个字符

        有几种特殊格式:
            [a-z],[0-9],[a-zA-Z],[a-z0-9]
            [[:upper:]]: 所有大写字母
            [[:lower:]]: 所有小写字母
            [[:alpha:]]: 所有字母
            [[:digit:]]: 所有数字
            [[:alnum:]]: 所有的字母和数字
            [[:blank:]]: 包含空格和tab
            [[:space:]]: 所有空白字符(blank+换行符)
            [[:punct:]]: 所有标点符号
基本正则表达式的元字符:
        字符匹配:
            .   : 匹配任意单个字符
            []  : 匹配指定范围内的任意单个字符
            [^] : 匹配指定范围外的任意单个字符
                如:
                    [:upper:]、[:lower:]、[:alpha:]、[:digit:]、[:alnum:]、[:punct:]、[:space:]...
        次数匹配:
            *  : 匹配其前面的字符任意次;可为0次;
            \? : 匹配其前面的字符1次或0次;
            \+ : 匹配其前面的字符至少1次;
            \{n\}: 匹配其前面的字符n次;
            \{m,\}: 匹配其前面的字符至少m次;
            \{m,n\}: 匹配其前面的字符至少m次,至多n次;
            \{0,n\}: 匹配前面的字符至少0次,至多n次;

        位置锚定:
            ^ : 行首锚定; 用于模式的最左侧;
            $ : 行尾锚定; 用于模式的最右侧;
            \< 或 \b : 词首锚定; 用于单词模式的左侧;
            \> 或 \b : 词尾锚定; 用于单词模式的右侧;

            ^PATTERN$: 用于PATTERN来匹配整行;
                ^$: 空白行;
                ^[[:space:]]*$: 空白行或包含空白字符的行;
            单词: 非特殊字符组成的连续字符(字符串)都称为单词;

        分组及引用:
            \(\): 将一个或多个字符捆绑在一起,当作一个整体进行处理;

                分组括号中的模式匹配到的内容会被正则表达式引擎自动记录于内部的变量中,这些变量为:
                    \1: 模式从左侧起,第一个左括号以及与之匹配的右括号之间的模式所匹配到的字符;
                    \2: 模式从左侧起,第二个左括号以及与之匹配的右括号之间的模式所匹配到的字符;
                    以此类推
                    ...

                后向引用: 引用前面的分组括号中的模式所匹配到的字符;使用以上变量进行调用;

        或:
            \| : PATTERN1或者PATTERN2;
扩展正则表达式的元字符:  (扩展基于标准正则,符号简化)

            |



本文转自 撒旦搞时间 51CTO博客,原文链接:http://blog.51cto.com/12074120/1963880,如需转载请自行联系原作者

版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。

相关文章
正则表达式常用元字符
正则表达式常用元字符
18 0
扩展正则表达式 | 学习笔记
快速学习扩展正则表达式。
92 0
正则表达式常用元字符
正则表达式常用元字符
61 0
正则表达式 - 元字符
基本 字符 描述 \ 将下一个字符转义 ^ 匹配输入字符串的开始位置 $ 匹配输入字符串的结束位置 . 匹配除 "\n" 之外的任何单个字符。
812 0
正则表达式(一):常用元字符
正则是什么 正则表达式是一种字符串模式,用来对某些规则的文本内容进行处理。利用字符串构成成的数据结构,来完成对文本内容的匹配。 经常可以看到正则表达式的句子里包含了一些\d、\w和()之类的符号,这些特殊格式的符号可以看做正则结构中的元素,这些符号也成之为元字符,下面介绍下这些元字符的作用。
816 0
文章
问答
文章排行榜
最热
最新
相关电子书
更多
低代码开发师(初级)实战教程
立即下载
阿里巴巴DevOps 最佳实践手册
立即下载
冬季实战营第三期:MySQL数据库进阶实战
立即下载