%d 十进制有符号整数 %u 十进制无符号整数 %f 浮点数 %s 字符串 %c 单个字符 %p 指针的值 %e 指数形式的浮点数 %x, %X 无符号以十六进制表示的整数 %0 无符号以八进制表示的整数 %g 自动选择合适的表示法 \n 换行 \f 清屏并换页 \r 回车 \t Tab符 \xhh 表示一个ASCII码用16进表示,其中hh是1到2个16进制数 说明: (1). 可以在"%"和字母之间插进数字表示最大场宽。 例如: %3d 表示输出3位整型数, 不够3位右对齐。 %9.2f 表示输出场宽为9的浮点数, 其中小数位为2, 整数位为6,小数点占一位, 不够9位右对齐。 %8s 表示输出8个字符的字符串, 不够8个字符右对齐。 如果字符串的长度、或整型数位数超过说明的场宽, 将按其实际长度输出.但对浮点数, 若整数部分位数超过了说明的整数位宽度, 将按实际整数位输出;若小数部分位数超过了说明的小数位宽度, 则按说明的宽度以四舍五入输出. 另外, 若想在输出值前加一些0, 就应在场宽项前加个0。 例如: %04d 表示在输出一个小于4位的数值时, 将在前面补0使其总宽度为4位。 如果用浮点数表示字符或整型量的输出格式, 小数点后的数字代表最大宽度,小数点前的数字代表最小宽度。 例如: %6.9s 表示显示一个长度不小于6且不大于9的字符串。若大于9, 则第9个字符以后的内容将被删除。 echo 1.7 > 2 awk '{printf ("%d\n",$1)} 2 1 awk '{printf ("%f\n",$1)}' 2 1.700000 awk '{printf ("%3.1f\n",$1)}' 2 1.7 awk '{printf ("%4.1f\n",$1)}' 2 1.7 awk '{printf ("%e\n",$1)}' 2
print 拼装rm命令实现,查找文件并删除
#!/bin/sh LOCATE=/home/samba find $LOCATE -name '*.eml'>log find $LOCATE -name '*.nws'>>log gawk '{print "rm -rf "$1}' log > rmfile chmod 755 rmfile ./rmfile
输出包含(不包含)特定字符的行(sed也可以完成该功能): :~$ awk '/[a-c]/ { print }' file.txt daemon x 1 1 daemon /usr/sbin /bin/sh bin x 2 2 bin /bin /bin/sh sys x 3 3 sys /dev /bin/sh sync x 4 65534 sync /bin /bin/sync games x 5 60 games /usr/games /bin/sh man x 6 12 man /var/cache/man /bin/sh lp x 7 7 lp /var/spool/lpd /bin/sh mail x 8 8 mail /var/mail /bin/sh news x 9 9 news /var/spool/news /bin/sh uucp x 10 10 uucp /var/spool/uucp /bin/sh proxy x 13 13 proxy /bin /bin/sh www-data x 33 33 www-data /var/www /bin/sh backup x 34 34 backup /var/backups /bin/sh list x 38 38 Mailing List Manager /var/list /bin/sh irc x 39 39 ircd /var/run/ircd /bin/sh gnats x 41 41 Gnats Bug-Reporting System (admin) /var/lib/gnats /bin/sh nobody x 65534 65534 nobody /nonexistent /bin/sh libuuid x 100 101 /var/lib/libuuid /bin/sh syslog x 101 103 /home/syslog /bin/false sshd x 102 65534 /var/run/sshd /usr/sbin/nologin landscape x 103 108 /var/lib/landscape /bin/false mysql x 104 112 MySQL Server,,, /var/lib/mysql /bin/false ntpd x 105 114 /var/run/openntpd /bin/false postfix x 106 115 /var/spool/postfix /bin/false nagios x 107 117 /var/lib/nagios /bin/false chun x 1003 1003 Li Fu Chun,,, /home/chun munin x 108 118 /var/lib/munin /bin/false $ awk '!/[a-c]/ { print }' file.txt root x 0 0 root /root neo x 1000 1000 neo,,, /home/neo 采用判断来输出特定的列数据: neo@monitor:~$ sed -e 's/:/ /g' /etc/passwd | awk '$1 == "neo" { print $1 }' neo 部分包含,不包含指定的字符: $ awk '$1 ~ /[a-d]/ { print }' file.txt $ awk '$1 !~ /[a-d]/ { print }' file.txt
# awk '/www/,/Web/ {print}' /etc/passwd www:x:80:80:Web User:/www:/bin/bash # awk '/www/,/[Ww]eb/ {print}' /etc/passwd www:x:80:80:Web User:/www:/bin/bash
cat /var/log/rinetd.log | awk -F' ' '$7 ~ /0/ {print $1"\t"$2"\t"$7"\t"$8"\t"$9}'
# cat /var/log/rinetd.log | awk -F' ' '$7 ~ /(210|209|210)/ {print $1"\t"$2"\t"$7"\t"$8"\t"$9}'
例如 : awk 读入第一笔数据行 "aaa bbb ccc ddd" 之后, 程序中: $0 之值将是 "aaa bbb ccc ddd" $1 之值为 "aaa" $2 之值为 "bbb" $3 之值为 "ccc" $4 之值为 "ddd" $NF 之值为 4 $NR 之值为 1
NR=n 指定n行号
# awk -F':' 'NR==1 {print $(1)}' /etc/passwd root # awk -F':' 'NR==2 {print $(1)}' /etc/passwd bin
取 1,3,4行
# awk 'NR==1; NR==3; NR==4 {print $1}' /etc/passwd root:x:0:0:root:/root:/bin/bash daemon:x:2:2:daemon:/sbin:/sbin/nologin adm:x:3:4:adm:/var/adm:/sbin/nologin
awk ... '{if(NR=1){...}else{exit)}'
$ awk -F' ' '{if(NR==1) print $1}' /etc/issue Ubuntu
# echo "aaa bbb ccc ddd" | awk '{print $(NR)}' aaa # echo "aaa bbb ccc ddd" | awk '{print $(NR+1)}' bbb # echo "aaa bbb ccc ddd" | awk '{print $(NR+2)}' ccc # echo "aaa bbb ccc ddd" | awk '{print $(NF)}' ddd # echo "aaa bbb ccc ddd" | awk '{print $(NF-1)}' ccc # echo "aaa bbb ccc ddd" | awk '{print $(NF-2)}' bbb uptime | awk '{print $(NF-2)}'
[root@netkiller ~]# netstat -na |awk '/^tcp/ {print NF}' | head -n 1 6 [root@netkiller ~]# netstat -ant |awk '/^tcp/ {print $NF}' | tail -n 5 TIME_WAIT CLOSE_WAIT CLOSE_WAIT LISTEN LISTEN [root@netkiller ~]# netstat -ant |awk '/^tcp/ {print $(NF-5)}' | tail -n 5 tcp tcp tcp tcp6 tcp6
[root@netkiller ~]# ss -ant | awk '{++S[$1]} END {for(a in S) print a, S[a]}' LISTEN 13 CLOSE-WAIT 42 ESTAB 95 State 1 FIN-WAIT-2 20 LAST-ACK 44 SYN-SENT 10 TIME-WAIT 403
[root@netkiller ~]# ss -ant | awk 'BEGIN {stats["CLOSE-WAIT"]=0;stats["ESTAB"]=0;stats["FIN-WAIT-1"]=0;stats["FIN-WAIT-2"]=0;stats["LAST-ACK"]=0;stats["SYN-RECV"]=0;stats["SYN-SENT"]=0;stats["TIME-WAIT"]=0} {++stats[$1]} END {for(a in stats) print a, stats[a]}' LISTEN 6 SYN-RECV 0 ESTAB 4 CLOSE-WAIT 0 State 1 FIN-WAIT-1 0 LAST-ACK 0 FIN-WAIT-2 0 TIME-WAIT 3 SYN-SENT 0
netstat -ant | awk '/^tcp/ {++state[$NF]} END {for(key in state) print key,"\t",state[key]}' TIME_WAIT 88 CLOSE_WAIT 6 FIN_WAIT1 9 FIN_WAIT2 9 ESTABLISHED 303 SYN_RECV 126 LAST_ACK 5 ss | awk '$1 !~ /State/ {++state[$1]} END {for(key in state) print key,"\t",state[key]}' LAST-ACK 1 ESTAB 5 FIN-WAIT-2 1 CLOSE-WAIT 13
# cat /etc/passwd | awk -F':' '{++shell[$NF]} END {for(key in shell) print key,"\t",shell[key]}' /sbin/shutdown 1 /bin/sh 1 /bin/bash 3 /sbin/nologin 20 /sbin/halt 1 /bin/sync 1
# cat /www/logs/access.log | egrep -o 'GET|POST' | awk '{++method[$NF]} END {for(num in method) print num, method[num]}' POST 422 GET 188571 # cat /www/logs/access.log | egrep -o 'GET|POST' | awk '{++method[$1]} END {for(num in method) print num, method[num]}' POST 422 GET 188573
grep 'Baiduspider' access.2011-02-22.log | awk '{print $1}' | awk '! a[$0]++'
awk '! a[$0]++' 1.txt >2.txt 这个是删除文件中所有列都重复的记录 awk '! a[$1]++' 1.txt >2.txt 删除文件中第一列重复的记录 awk '! a[$1,$2]++' 1.txt >2.txt 删除文件中第一,二列都重复的记录
原文出处:Netkiller 系列 手札
本文作者:陈景峯
转载请与作者联系,同时请务必标明文章原始出处和作者信息及本声明。