一、内容概述
正则表达式的基本定义,使用方法及搭配命令
流编辑器的特点及使用方法
二、正则元字符
2.1 基础表达式
- .:匹配任意字符
- *:匹配字符任意次数(包括0次)
- ^字符:以对应字符开头的行
- 字符$:以对应字符结尾的行
- ^$:空行
- [字符]:匹配范围内的字符
2.2 扩展表达式
- ?:匹配零次或一次
- +:匹配一次或一次以上
- {n}:匹配n次以上
- {n,m}:匹配字符至少n次,至多m次
三、搭配命令
3.1 sort(排序)
- sort 选项 参数
| 选项 | 作用 |
| -n | 按照数字大小排序 |
| -r | 反向排序,可搭配-n使用 |
| -u | 排序后压缩想同行 |
| -t | 指定字符分隔符,默认为tab制表符 |
| -f | 忽略大小写 |
| -b | 忽略行首空格 |
| -k | 指定排序字段 |
| -o 文件名 | 将排序后的结果另存为文件 |
3.2 uniq(统计)
- uniq -c 字符 文件:压缩相同字符行,并统计重复次数
3.3 tr(替换)
- tr 选项 字符1 字符2
| 选项 | 作用 |
| 无 | 将字符1全部替换为字符2 |
| -c | 除了字符1,其余字符全部替换为字符2(包含换行符\n) |
| -d | 删除所有匹配的字符 |
| -s | 压缩连续的匹配字符 |
3.4 echo(输出)
- echo -n 内容:不换行输出(删除默认自带的换行符\n)
- echo -e 内容 参数:-e代表调用后方参数
| 选项 | 作用 |
| \n | 换行符,换行输出 |
| \t | 插入tab键,制表符 |
| \\ | 转义符,输出字符 \ 本身 |
| \b | 退格,删除一个字符 |
| \c | 抑制后方输出,包括换行符 |
| \f | 换行,但光标留在原处 |
四、grep/sed/awk(文本三剑客)
4.1 grep(内容查询)
- grep 选项 条件 文件
| 选项 | 作用 |
| -i | 忽略大小写 |
| -n | 输出匹配内容同时显示行号 |
| -v | 取反查找 |
| -o | 只显示匹配项 |
| -c | 统计匹配字符的总行数 |
| -f | 显示两个文件相同内容(以行位单位,但行号可不同) |
4.2 awk(流查询器)
- awk 语法 文件:默认空格为分隔符
- awk -F字符 语法 文件:指定字符为分割符
| 语法 | 作用 |
| ‘{print $1}’ | 打印分割后的第一列内容 |
| ‘a[“$1”]++;{print a[“$1”]}’ | 每当出现重复的下标,则该下标数组值自增1,统计下标共计重复出现多少次 |
| ‘BEGIN{i=0} {i++} END{print i}’ | BEGIN扫描前执行一次;中间括号awk每扫描一次,则执行一次;END扫描结束后执行一次 |
- awk内置特殊变量
| 变量 | 含义 |
| NR | 扫描到内容后,值加一(相当于行号) |
| FNR | 扫描到内容后,值加一;遇到第二个文件时,从零重新计算 |
| NF | 当前行中的字段个数 |
| FS | 输入字段分隔符(默认空格) |
| OFS | 输出字段分隔符(默认空格) |
| RS | 输入记录分隔符(默认空格) |
| ORS | 输出记录分割符(默认空格) |
4.3 sed(流编辑器)
- sed 选项 语法 文件
| 选项 | 作用 |
| -n | 不显示处理过程及原文件内容 |
| -i | 保存处理过程到文件,不要与-n同用,会删除原文件内容 |
| -e | 将下一个参数作为指令 |
| -f | 调用包含sed命令文件的sed |
| 语法 | 含义 |
| a | 在匹配行后面插入内容 |
| i | 在匹配行前方插入内容 |
| c | 更改匹配的行 |
| d | 删除匹配行的内容 |
| s | 替换匹配行的内容 |
| p | 打印处理过的内容 |
| = | 打印匹配行的行号 |
| n | 跳过匹配行,匹配下一行 |
| r | 读取另外文件的文件内容到当前文本中 |
| w | 将匹配行的内容另存为文件 |
| ‘ ’ | 无法识别变量:‘s/被替换字符/替换字符/’ |
| " " | 可识别变量:”s/被替换字符/替换变量/” |
五、思维导图
