4. 脚本
关于awk脚本,我们需要注意两个关键词BEGIN
和END
。
BEGIN{ 这里面放的是执行前的语句 }
END {这里面放的是处理完所有的行后要执行的语句 }
{这里面放的是处理每一行时要执行的语句}
假设有这么一个文件(学生成绩表):
$ cat score.txt Marry 2143 78 84 77 Jack 2321 66 78 45 Tom 2122 48 77 71 Mike 2537 87 97 95 Bob 2415 40 57 62
$ cat cal.awk #!/bin/awk -f #运行前 BEGIN { math = 0 english = 0 computer = 0 printf "NAME NO. MATH ENGLISH COMPUTER TOTAL\n" printf "---------------------------------------------\n" } #运行中 { math+=$3 english+=$4 computer+=$5 printf "%-6s %-6s %4d %8d %8d %8d\n", $1, $2, $3,$4,$5, $3+$4+$5 } #运行后 END { printf "---------------------------------------------\n" printf " TOTAL:%10d %8d %8d \n", math, english, computer printf "AVERAGE:%10.2f %8.2f %8.2f\n", math/NR, english/NR, computer/NR }
我们来看一下执行结果:
$ awk -f cal.awk score.txt NAME NO. MATH ENGLISH COMPUTER TOTAL --------------------------------------------- Marry 2143 78 84 77 239 Jack 2321 66 78 45 189 Tom 2122 48 77 71 196 Mike 2537 87 97 95 279 Bob 2415 40 57 62 159 --------------------------------------------- TOTAL: 319 393 350 AVERAGE: 63.80 78.60 70.00
5. 自定义函数
用户自定义函数的语法格式为:
function function_name(argument1, argument2, ...) { function body }
function_name 是用户自定义函数的名称。函数名称应该以字母开头,其后可以是数字、字母或下划线的自由组合。AWK
保留的关键字不能作为用户自定义函数的名称。
自定义函数可以接受多个输入参数,这些参数之间通过逗号分隔。参数并不是必须的。我们也可以定义没有任何输入参数的函数。
function body 是函数体部分,它包含 AWK 程序代码。
求最大值与最小值
# 返回最小值 function find_min(num1, num2) { if (num1 < num2) return num1 return num2 } # 返回最大值 function find_max(num1, num2) { if (num1 > num2) return num1 return num2 } # 主函数 function main(num1, num2) { # 查找最小值 result = find_min(10, 20) print "Minimum =", result # 查找最大值 result = find_max(10, 20) print "Maximum =", result } # 脚本从这里开始执行 BEGIN { main(10, 20) }
执行 functions.awk 文件,可以得到如下的结果:
$ awk -f functions.awk Minimum = 10 Maximum = 20
6. 数组
AWK 可以使用关联数组这种数据结构,索引可以是数字或字符串。
AWK关联数 组也不需要提前声明其大小,因为它在运行时可以自动的增大或减小。
数组使用的语法格式:
array_name[index]=value
- array_name:数组的名称
- index:数组索引
- value:数组中元素所赋予的值
6.1 创建数组
接下来看一下如何创建数组以及如何访问数组元素:
$ awk 'BEGIN { sites["runoob"]="www.runoob.com"; sites["google"]="www.google.com" print sites["runoob"] "\n" sites["google"] }'
执行以上命令,输出结果为:
www.runoob.com www.google.com
6.2 删除数组元素
我们可以使用 delete 语句来删除数组元素,语法格式如下:
delete array_name[index
下面的例子中,数组中的 google 元素被删除(删除命令没有输出):
$ awk 'BEGIN { sites["runoob"]="www.runoob.com"; sites["google"]="www.google.com" delete sites["google"]; print fruits["google"] }'
输出为空。
6.3 多维数组
下面是模拟二维数组的例子:
$ awk 'BEGIN { array["0,0"] = 100; array["0,1"] = 200; array["0,2"] = 300; array["1,0"] = 400; array["1,1"] = 500; array["1,2"] = 600; # 输出数组元素 print "array[0,0] = " array["0,0"]; print "array[0,1] = " array["0,1"]; print "array[0,2] = " array["0,2"]; print "array[1,0] = " array["1,0"]; print "array[1,1] = " array["1,1"]; print "array[1,2] = " array["1,2"]; }'
执行上面的命令可以得到如下结果:
array[0,0] = 100 array[0,1] = 200 array[0,2] = 300 array[1,0] = 400 array[1,1] = 500 array[1,2] = 600
7. split 切割
$ ip=$(kubectl get pod www -o yaml |grep podIP | awk '{split($0,a,":"); print a[2]}'); echo $ip 10.32.0.6