用awk数组处理两个文件的例子

简介: 收了本论坛的三个例子 QUOTE: 1、用某一文件的一个域替换另一个文件中的的特定域? http://bbs.chinaunix.net/forum/viewtopic.php?t=500015文件passwd: s2002408030068:x:527:527::/home/d...
收了本论坛的三个例子

QUOTE:
1、用某一文件的一个域替换另一个文件中的的特定域?
http://bbs.chinaunix.net/forum/viewtopic.php?t=500015
文件passwd:
s2002408030068:x:527:527::/home/dz02/s2002408030068:/bin/pw
s2002408032819:x:528:528::/home/dz02/s2002408032819:/bin/pw
s2002408032823:x:529:529::/home/dz02/s2002408032823:/bin/pw

文件shadow:
s2002408030068:$1$d8NwFclG$v4ZTacfR2nsbC8BnVd3dn1:12676:0:99999:7:::
s2002408032819:$1$UAvNbHza$481Arvk1FmixCP6ZBDWHh0:12676:0:99999:7:::
s2002408032823:$1$U2eJ3oO1$bG.eKO8Zupe0TnyFhWX9Y.:12676:0:99999:7:::

用shadow文件中的密文部分替换passwd中的"x",生一个新passwd文件,如下所示
s2002408030068:$1$d8NwFclG$v4ZTacfR2nsbC8BnVd3dn1:527:527::/home/dz02/s2002408030068:/bin/pw
s2002408032819:$1$UAvNbHza$481Arvk1FmixCP6ZBDWHh0:528:528::/home/dz02/s2002408032819:/bin/pw
s2002408032823:$1$U2eJ3oO1$bG.eKO8Zupe0TnyFhWX9Y.:529:529::/home/dz02/s2002408032823:/bin/pw

awk 'BEGIN{OFS=FS=":"} NR==FNR{a[$1]=$2}NR>FNR{$2=a[$1];print}' shadow passwd

NR==FNR,第一个文件shadow,以$1为下标,将$2的值赋给数组a
NR>FNR,第二个文件passwd,将文件shadow$2的值赋值给文件passwd



QUOTE:
2、
cat file1:
0011AAA 200.00 20050321
0012BBB 300.00 20050621
0013DDD 400.00 20050622
0014FFF 500.00 20050401

cat file2:
I0011  11111
I0012  22222
I0014  55555
I0013  66666

规则:比较 file1的1-4字符 和 file2的2-5 字符,如果相同,将file2 的第二列 与 file1 合并 file3

0011AAA 200.00 20050321 11111
0012BBB 300.00 20050621 22222
0013DDD 400.00 20050622 66666
0014FFF 500.00 20050401 55555

awk  'NR==FNR{a[substr($1,2,5)]=$2}NR>FNR&&a[b=substr($1,1,4)]{print $0, a[b]}' file2 file1 >file3




QUOTE:
3、如果文件a中包含文件b,则将文件b的记录打印出来
http://bbs.chinaunix.net/forum/viewtopic.php?t=520411

文件a:
10/05766798607,11/20050325191329,29/0.1,14/05766798607
10/05767158557,11/20050325191329,29/0.08,14/05767158557

文件b:
05766798607
05766798608
05766798609
通过文件a和文件b对比,导出这样的文件出来.
10/05766798607,11/20050325191329,29/0.1,14/05766798607

a

wk -F'[/,]' 'ARGIND==1{a[$0]}ARGIND>1{($2 in a);print $0}' b a
awk -F'[/,]' 'NR==FNR{a[$0]}NR>FNR{($2 in a);print $0}' b a




QUOTE:
4、
file1文件内容
   1     0.5  100
                                 10  15    36.5
file2文件
        50   10    9
                                 3.2   1     5
将两个文件合成一个文件如:
   51     10.5    109
                                                              13.2   16      41.5
就是对应的字段进行相加以后的数字。
awk '{for (i=1;i=$i
getline for (i=1;i" ";
printf $NF+a[NF] "\n"}' file1

awk '{for (i=1;i




QUOTE:
5、
文件a
1000 北京市 地级 北京市 北京市
1100 天津市 地级 天津市 天津市
1210 石家庄市 地级 石家庄市 河北省
1210 晋州市 县级 石家庄市 河北省
1243 滦县 县级 唐山市 河北省
1244 滦南县 县级 唐山市 河北省

b文件:
110000,北京市
120000,天津市
130000,河北省
130131,平山县
130132,元氏县
这样的字段
a中第二列在b中可能有可能没有,需要把有的匹配起来生成新的一列:要包含a和b的第一列。没有匹配的按照b原来的格式进行输出。

awk 'BEGIN{FS="[ |,]";OFS=","}NRFNR{print $1,$2,a[$2]}' a b




QUOTE:
6、
file1的第一列与file2的第3列相同,
file1的第二列与file2的第4列的3-5位相同,
file1的第三列与file2的最后一列相同,
# cat file1
AAA  001  1000.00
BBB  001  2000.00
DDD  002  4000.00
EEE  002  5000.00
FFF  003  6000.00
# cat file2
01 1111  AAA  WW001  $$$$  1000.00
02 2222  BBB  GG001  %%%%  2000.00
03 3333  CCC  JJ001  ****  3000.00
04 4444  DDD  FF002  &&&&  4000.00
05 5555  EEE  RR002  @@@@  5000.00
06 666   FFF  UU003  JJJJ  6000.00
07 777   III  II005  PPPP  7000.00
08 8888  TTT  TT008  TTTT  8000.00

# awk 'NR> NR>FNR{b=substr($4,3);c=$3"x"b"x"$6;if(c==a[$3]) print}' file1 file2
01 1111  AAA  WW001  $$$$  1000.00
02 2222  BBB  GG001  %%%%  2000.00
04 4444  DDD  FF002  &&&&  4000.00
05 5555  EEE  RR002  @@@@  5000.00
06 666   FFF  UU003  JJJJ  6000.00


阅读(2143) | 评论(1) | 转发(1) |
相关文章
|
12天前
|
安全 C++ 索引
5个提升Python编码效率的小技巧
5个提升Python编码效率的小技巧
294 134
|
12天前
|
SQL 安全 大数据
PHP开发中的几个实用技巧
PHP开发中的几个实用技巧
222 134
|
12天前
|
索引 Python
五个提升效率的Python技巧
五个提升效率的Python技巧
286 134
|
12天前
|
Python
5个提升Python编程效率的技巧
5个提升Python编程效率的技巧
238 132
|
17天前
|
索引 Python
Python 技巧让你的代码更Pythonic
Python 技巧让你的代码更Pythonic
158 124
|
17天前
|
PHP
PHP技巧分享:提升开发效率的5个小妙招
PHP技巧分享:提升开发效率的5个小妙招
190 128
|
17天前
|
Python
提升Python代码质量的4个实用技巧
提升Python代码质量的4个实用技巧
167 134
|
17天前
|
Go 数据处理
5个实用的Go编程技巧
5个实用的Go编程技巧
186 134
|
17天前
|
Go 数据库 微服务
Go语言技巧:利用Context实现优雅的超时控制
Go语言技巧:利用Context实现优雅的超时控制
196 129
|
1月前
|
数据采集 运维 数据挖掘
《分布式跨域业务事务可用性与性能度量手册》
本文聚焦分布式系统中跨数十服务的业务事务,提出一套脱离单点指标局限的全域度量体系。文章从语义锚定与边界切片完成事务定义,构建以稳态存续度、断层自愈率为核心的可用性评估模型,提出流转时延熵、节点协同滞涩度衡量整体性能,通过事务态画像与趋势推演因子实现数据落地,并强调度量体系需动态域校准与弹性适配。全文结合实践思考,阐述跨服务业务事务可用性与性能的深度度量方法,为分布式系统优化提供可落地的技术思路。
207 133

热门文章

最新文章