文本处理:sed
1.sed工作流程
sed读一行放到模式空间进行处理
sed是一种在线的、非交互式的编辑器,它一次处理一行内容,处理时,把当前处理的行存储在临时缓冲区中,成为模式空间,接着用sed命令处理缓冲区中的内容,处理完成后,把缓冲区的内容送往屏幕。接着处理下一行,这样不断重复,直到文件末尾,文件内容并没有更改,除非使用重定向存储输出。
sed主要用来自动编辑一个或多个文件,简化对文件的反复操作,编写转换程序
sed -ri.bak
sed -ric --follow-symlinks
2.命令格式
sed [options] ‘command’ file(s) //选项后面跟命令
sed [options] -f scriptfile file(s) //选项后面跟sed命令的脚本
注意:
sed中空格也算一个字符
sed和grep不一样,不管是否找到指定的模式,它的退出转态都是0,只有当命令存在语法错误时,sed的退出状态码才是非0
sed命令在使用命令时,不加数字的话默认对每一行都进行模式匹配
例如 sed -r ‘4p’ //p命令表示打印,4p就是对第四行进行打印,其他行不会执行这个命令,如果是sed -r 'p’则是对每一行都执行此命令
3.支持正则表达式
与grep一样,sed在文件中查找模式时也可以使用正则表达式(RE)和各种元字符。正则表达式是括在斜杠间的面膜是,用于查找和替换,以下是sed支持的元字符。
使用基本元字符集^,$,.,*,[],[^],\<\>,\(\),\{\} 使用扩展元字符集?,+,{},|,()=
使用扩展元字符的方式:
\+ sed -r
4.sed基本用法
sed -r 'p' passwd.txt //打印所有行,会出现之前行的两倍,因为是原理就是先将一行放到屏幕然后在执行p命令,p命令是打印所以又会显示一行 sed -rn 'p' passwd.txt //使用-n选项,可以忽略执行命令之前的行 sed -rn '/root/p' passwd.txt //命令中的/root/p是指找到root的行进行打印 sed -r 's/root/jxl/' passwd.txt //找到root的行替换成jxl,仅限第一个找到的 sed -r 's/root/jxl/g' passwd.txt //全局替换 sed -r '1s/root/jxl/g' passwd.txt //在第一行查找并替换 sed -r '1s/Root/jxl/gi' passwd.txt //i表示忽略大小写 sed -r '/root/d/' passwd.txt //找到root的行然后删除 sed -r '\#root#d' passwd.txt //斜线可以换成任意符号一般想换建议使用#号 如果文件中需要修改的内容带有"/"斜线,可以使用下面的方法进行修改 sed -r 's/\/etc\/abc/\/var\/lib/' passwd.txt //将/etc/abc改成/var/lib,主要除了s///其他的斜线要用反斜线转义 sed -r 's#/etc/abc#var/lib#' passwd.txt //可以将斜线换成#,也可以是@,在这里的其他符号可以不用转义因为后面有了/
5.sed扩展
地址(定址)
地址用于决定对那些行进行编辑,地址形式可以是数组、正则表达式或二者的组合,如果没有设定地址,sed将处理输入文件中的所有行
sed -r 'd' passwd.txt //删除所有行 sed -r '3d' passwd.txt //删除第三行 sed -r '1,3d' passwd.txt //删除一到三行 sed -r '/^root/d' passwd.txt //删除以root开头的行 sed -r '/bash$/d' passwd.txt //删除以bash结尾的行 sed -r '/\<root\>/d' passwd.txt //删除是root这个单词的行 sed -r '/root/,5d' passwd.txt //从root行开始删除到第5行 sed -r '/root/,+5d' passwd.txt //删除root行后在删除5行 sed -r 'root/!d' passwd.txt //!取反,只保留root行 sed -r '1~2d' passwd.txt //删除奇数行 sed -r '0~2d' paswd.txt //删除偶数行 sed -r '1~3d' passwd.txt //删掉一行后留两行在删一行留两行
6.sed命令
sed命令告诉sed对指定行进行何种操作,包括打印、删除、修改等
a 在当前行后添加一行或多行
c 用新文本修改替换当前行中的文本
d 删除行
i 在当前行之前插入文本
l 列出非打印字符 多打印一行,并在后面加上$
p 打印行
n 获取下一行的内容,常用于要处理的行没有明显特征,可以借助上一行在使用n对下一行进行处理
q 结束或退出sed
! 对所选航意外的所有行应用命令
S 用一个字符串替换另一个
s 替换标志
g 全局替换
i 忽略大小写
r 从文件中读
w 将行写入文件
y 将字符转换为另一字符
h 把模式空间里的内容复制到暂存缓冲区(覆盖)
H 把模式空间里的内容追加到暂存缓冲区
G 取出暂存缓冲区的内容,将其复制到模式空间,追加在原有内容后面
g 取出暂存空间的内容,将其复制到模式空间中,原来的内容会被覆盖
x 交换暂存缓冲区与模式空间的内容
选项
-e 允许多项编辑,使用多个命令
-f 指定sed脚本文件名
-n 取消默认的输出
-i inplace,就地编辑也就是在文件中直接修改
-r 支持扩展元字符
7.命令示例
删除命令:d
如果想要多个命令同时使用就在{}中以分号分隔
sed -r '3d' passwd.txt //删除第三行 sed -r '3{d;}' passwd.txt //花括号中的d;其实表示可以使用多个命令选项,例如sed -r '3{p;d;}' passwd.txt sed -r '3p;3d' passwd.txt //多个命令使用,等同于3{p;d} sed -r '3{d}' passwd.txt //效果与3d一样 sed -r '3,$d' passwd.txt //从第三行开始一直删除到最后一行 sed -r '$d' passwd.txt //删除最后一行 sed -r '/norrth/d' datafile //删除匹配north的行
替换命令:s
sed -r 's/west/north/g' datafile //将west替换成north sed -r 's/^west/north/' datafile //将west开头的行换成north sed -r 's/[0-9][0-9]$/&.5/' datafile //&表示在查找串中匹配的内容,也就是将查找出来的内容再次调用,以二个数字为结尾的换成原行在跟一个.5 sed -r 's/(.*)/#\1\' //在每一行前面加上#号 sed -r '1,5s/.*/#&/' //将一到五行开头加上#号 sed -r '1,5s/^/#' //也是1-5行前面加#号 sed -r 's/Hemenway/Jones/g' datafile //将Hemenway换成jones sed -r 's/(Mar)got/\1ianne/g' datafile //将Mar做成组字符,在ianne前面调用也就是将margot换成morianne sed -r 's#3#88#g' //将3换成88 sed -r 's/[0-9]+$/&.5/' passwd.txt //将结尾是数字的一个或多个的行在后面加上.5 sed -r 's/(.)(.)(.*)/\1\2jiang\3/' passwd.txt //第一个.表示第一个字符第二个.表示第二个字符第三个.*表示整行,也就是在第二个字符后面加其他内容可以在调用完1,2后跟上所需内容在调用3 sed -r 's/(.*)(.)(.)/\1jiang\2\3/' passwd.txt //在最后二个字符前加其他内容 ====================================================================================== sed -r 's/root/jiangxiaolong/g' passwd.txt //将root换成jiangxiaolong sed -r 's/^root/jiangxiaolong/g' passwd.txt //将root开头的行换成jiangxiaolong sed -r 's/[0-9][0-9]$/&.5/' passwd.txt //两个数字结尾的行换成原行内容在跟一个.5 &代表匹配的内容再次调用出来 sed -r 's/(.*)/#\1/' passwd.txt //将所有行前面加# sed -r 's/.*/#&/' passwd.txt //将所有行前面加#,使用&方式调用获得结果 sed -r 's/^/#/' passwd.txt //将所有行前面加# sed -r 's/^(ro)ot/\1jiang/' passwd.txt //将ro做成组字符,然后后面调用,也就是将root改成rojiangxiaolong sed -r 's/(.)(.)(.*)/\1\2jiang\3/' passwd.txt //在每一行的第二个字符前面加上任意内容,空格也代表一个字符 sed -r 's/(.*)(.)(.)/\1jiang\2\3/' passwd.txt //在每一行结尾的最后两个字符前加其他内容
读文件命令:r
sed -r '/lp/r /etc/hosts' passwd.txt //在lp行后面插入/etc/hosts/文件的内容 sed -r '2r /etc/hosts' passwd.txt //在第二行后面读入/etc/hosts/中的内容 sed -r '/2/r /etc/hosts' passwd.txt //这个跟2r有区别,这里是2在//中表示正则匹配,只有出现2的地方就会读入/etc/host
写文件命令:w
另存为的文件必须要有写入权限
每次另存到同一个文件,之前文件的内容会被覆盖掉
sed -r '/root/w /tmp/a.txt' passwd.txt //查找包含root的行,并保存到/tmp/a.txt文件中 sed -r '3,$w /tmp/a.txt' passwd.txt //从第三行一直到最后一行保存到/tmp/a.txt文件中
追加命令:a
sed -r '2a chkconfig 35 21 85' passwd.txt //在第二行后面追加内容 sed -r '/root/a jiangxiaolong' passwd.txt //在包含root的行后面加内容 sed -r '2a jiang\ >xiao\ >long' passwd.txt //第二行后面追加多行
插入命令:i
sed -r '2i jiang' passwd.txt //在第二行插入内容 sed -r '/root/i jiang' passwd.txt //在包含root的行插入内容,会在root行前面插入 sed -r '2i jiang\ >xiao\ >long' passwd.txt //在二行插入这些内容,这些内容会从第二行开始插入
修改命令:c
sed -r '/root/c jiang' passwd.txt //将root行换成jiang sed -r '1c jiang' passwd.txt //将第一行的内容换成jiang sed -r '1c 1111\ > 222\ > 333' passwd.txt //将第一行的内容换成1111并添加222 333
获取下一行:n
获取下一行的内容,常用于要处理的行没有明显特征,可以借助上一行在使用n对下一行进行处理,类似于隔山打牛,实际上匹配的这一行但是不对这一行做操作而是对下一行
sed -r '/lp/{n;d}' //查找lp的行并对下一行执行d命令 sed -r 'lp{n;s/sbin/bin/}' //查找lp的行并对下一行执行s命令 sed -r '/lp/{n;n;s/sbin/bin/}' passwd.txt //查找lp的行在它的下两行执行s命令,n可以使用多个,一个表示下一行,二个表示下二行
暂存和取用命令:h H g G
sed命令除了模式空间还有暂存空间,所谓暂存空间就是把一行处理后放到一个暂存空间,在需要的时候进行调用,在暂存空间里小写的命令比如说h、g都是具有覆盖的功能,而大写的命令例如H、G都表示追加,暂存空间默认只有换行符
一般第一次放入暂存空间会使用覆盖的方式,因为默认会有一个空行
sed -r '1h;$G' passwd.txt //把第一行覆盖到暂存空间,在最后一行的时候将模式空间的内容追加到最后一行下面 sed -r '1{h;d};$G' passwd.txt //把第一行覆盖到暂存空间并删除,在最后一行在调用追加,相当于把第一行剪切到最后一行 sed -r '1h;2,$g' passwd.txt //把第一行覆盖到暂存空间,从第二行到最后一行,每读一行就从暂存空间调回来,这里用的g表示覆盖,因此每调用一次都会把原来的内容覆盖掉,这样整个文本都会和第一行一样 sed -r '1h;2,3H;$G' passwd.txt //把第一行覆盖到暂存空间,第二行第三行追加到暂存空间,在最后一行的时候在调用暂存空间的内容,这里的动作是追加
暂存空间与模式空间互换:x
互换是指,将暂存空间的内容换到模式空间,再将模式空间的内容放到了暂存空间
sed -r '3h;5x;$G' passwd.txt //将第3行覆盖到暂存空间,读到第5行时将暂存空间与模式空间的内容互换,也就是处理完后第五行的
取反命令:!
!一般放在命令前面
sed -r '1!a jiang' passwd.txt //除了第一行都追加
-e多重编辑
-e选项完全用不着可以说,可以使用;将每个命令隔开即可
如果要对同一行进行操作还可以用{}方式
sed -r -e '1,3d' -e 's/bin/aaa/g' passwd.txt sed -r '1,3d;s/sbin/bin/g' passwd.txt sed -r '2s/bin/jiang/g;2s/x/aaa/g' passwd.txt sed -r '2{s/bin/jiang/g;s/x/aaa/g}' passwd.txt
8.sed常见操作
删除配置文件中#号注释行
sed -r '/^#/d' /etc/vsftpd/vsftpd.conf //只删除文件中以#开头的行 sed -r '/^[ \t]*#/d' /etc/vsftpd/vsftpd.conf //删除以空格或者制表符出现0次或多次在跟一个#的行 sed -r '/^[ \t]*#d;/^[ \t]*$/d' /etc/vsftpd/vsftpd.conf //删除以空格或者制表符出现0次或多次在跟一个#的行并且删除只以空格或者制表符出现0次到多次结尾的行,也就是既删除注释行也删除空行 sed -r '/^[ \t]*#/!d' /etc/vsftpd/vsftpd.conf //取反只留下了注释行
删除配置文件中的//号注释行
sed -r '\#^[ \t]*//#d' szlxwj.txt • 1
删除无内容的空行
sed -r '/^$/d' /etc/vsftpd/vsftpd.conf sed -r '/^[ \t]*$/d' /etc/vsftpd/vsftpd.conf
删除注释行及空行
sed -r '/^[ \t]*#/d;/^[ \t]*$/d' /etc/vsftpd/vsftpd.conf sed -r '/^[ \t]*#|^[ \t]*$/d' /etc/vsftpd/vsftpd.conf //将两部分合为一部分,用|元字符代表或者的意思 sed -r '/^[ \t]*(#|$)/d' /etc/vsftpd/vsftpd.conf //利用元字符,因为前部分都一样只需要把不一样的地方用或者表示即可
修改文件
sed -ri '$a chroot_local_user=YES' /etc/vsftpd/vsftpd.conf //在最后一行追加内容 sed -ri '/^SELINUX=/cSELINUX=disabled' /etc/sysconfig/selinux //将开头为SELINUX的行整个换成SELINUX=disbaled sed -ri '/UseDNS/cUseDNS no' /etc/ssh/sshd_config
给文件行增加注释
sed -r '1,5s/(.*)/#\1/' passwd.txt sed -r '1,5s/.*/#&/' passwd.txt sed -r '1,5s/^/#$/' passwd.txt sed -r '1,5s/^#*/#/' passwd.txt //查找1到5行如果是以0到一个#号卡头的行换成一个#号 sed -ri '1,2s/(.*)/\t#\1/;3s/(.*)/#\1/' passwd.txt //1,2行增加一个制表符在加一个#号,3行只加一个#号 sed -r '1,3s/^[ \t]*#*/#/' passwd.txt //将1到3行中以空格或者制表符0个或多个开头的在跟一个#0个或多个替换成# sed -r '1,3s/^[ \t#]*/#/' passwd.txt //将以空格制表符#出现0到多次替换成# 删掉一个注释行 sed -ri '1,3s/(.)(.*)/\2/' passwd.txt
sed中引入变量
var=1111jiang //先定义变量 sed -r '3a$var' passwd.txt //这种方式是错误的,因为单引号是强引用,直接就会追加$var而不是对应的值 sed -r "3a$var" passwd.txt //使用双引号即可 sed -r 3a$var passwd.txt //不适用任何引号也可以 sed -r "$a$var" passwd.txt //这里双引号会把$a误以为是变量,也是错误的 sed -r '$a'"$var" passwd.txt //可以各自使用各自的引号 sed -r "\$a$var" passwd.txt //也可以使用\进行转义
文件内容倒转
sed -r '1!G;$!h;$!d' 12345.txt
l
var=1111jiang //先定义变量
sed -r '3av a r ′ p a s s w d . t x t / / 这 种 方 式 是 错 误 的 , 因 为 单 引 号 是 强 引 用 , 直 接 就 会 追 加 var' passwd.txt //这种方式是错误的,因为单引号是强引用,直接就会追加var
′
passwd.txt//这种方式是错误的,因为单引号是强引用,直接就会追加var而不是对应的值
sed -r "3av a r " p a s s w d . t x t / / 使 用 双 引 号 即 可 s e d − r 3 a var" passwd.txt //使用双引号即可 sed -r 3avar"passwd.txt//使用双引号即可sed−r3avar passwd.txt //不适用任何引号也可以
sed -r “a aavar” passwd.txt //这里双引号会把a 误 以 为 是 变 量 , 也 是 错 误 的 s e d − r ′ a误以为是变量,也是错误的 sed -r 'a误以为是变量,也是错误的sed−r
′
a’"$var" passwd.txt //可以各自使用各自的引号
sed -r “$a$var” passwd.txt //也可以使用\进行转义
文件内容倒转 ```shell sed -r '1!G;$!h;$!d' 12345.txt