文件内容如下:
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
|
[root@hxy tmp]
# cat file
[aa]
aa1
dd2
dd3
dd4
[bb]
dd5
dd6
dd7
xx8
dd9
[cc]
ee2
334
ghdfg7
uuu
ooo7
sdsd
ggg
gogo
pp[
gggs
ssss
jjjj
aaaa
|
我现在的需求是提取出[bb] 到[cc]之间的所有行
1
2
3
4
5
6
|
[bb]
dd5
dd6
dd7
xx8
dd9
|
1
2
3
4
5
6
7
|
[root@hxy tmp]
# awk -v RS= '/^\[bb]/' file
[bb]
dd5
dd6
dd7
xx8
dd9
|
这个怎么理解呢?
-v 大家度知道是指定变量的
所以这个-v一是同样的指定了RS=
等于空就是默认的输入分隔符为'\n'既是空行
so我们这里的文件就会被分为3行了
1
2
3
4
|
[root@hxy tmp]
# awk -v RS= '{print $1,$2,$3,$4,$5,$6,$7}' file
[aa] aa1 dd2 dd3 dd4
[bb] dd5 dd6 dd7 xx8 dd9
[cc] ee2 334 ghdfg7 uuu ooo7 sdsd
|
这样是不是好理解多了,我想打印哪一行就打印哪一行就行了
1
2
3
4
5
6
7
|
[root@hxy tmp]
# awk -v RS= 'NR==2 {print}' file
[bb]
dd5
dd6
dd7
xx8
dd9
|
这里的 NR==2 {print} 和 /^\[aa]/ 是同样的结果
第一个是明确了打印第二行
第二个是匹配[aa]然后打印[aa]所在的行,达到同样的结果
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
|
[root@hxy tmp]
# awk -v RS= 'NR==2,NR==3 {print}' file
[bb]
dd5
dd6
dd7
xx8
dd9
[cc]
ee2
334
ghdfg7
uuu
ooo7
sdsd
ggg
gogo
pp[
gggs
ssss
jjjj
aaaa
|
这样打印出来的是第二个域到第三个域之间的结果
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
|
[root@hxy tmp]
# awk -v RS= 'NR==1,NR==3 {print}' file
[aa]
aa1
dd2
dd3
dd4
[bb]
dd5
dd6
dd7
xx8
dd9
[cc]
ee2
334
ghdfg7
uuu
ooo7
sdsd
ggg
gogo
pp[
gggs
ssss
jjjj
aaaa
|
而这样打印的是第一个域到第三个域之间的结果
如果我只想打印第一域和第三域呢?
[root@hxy tmp]# awk -v RS= 'NR==1;NR==3 {print}' file
[aa]
aa1
dd2
dd3
dd4
[cc]
ee2
334
ghdfg7
uuu
ooo7
sdsd
ggg
gogo
pp[
gggs
ssss
jjjj
aaaa
这样就行了.
如果有其他的要求,在干要求改就行了到此实验结束.
本文转自 Forande 51CTO博客,原文链接:http://blog.51cto.com/853056088/1932477