引言
本部分将深入学习 Awk 的高级应用,以应对更为复杂的文本或字符串过滤任务。将介绍包括变量、数值表达式和赋值运算符在内的 Awk 功能。
这些概念与你之前可能在诸如shell、C、Python等许多编程语言中接触过的概念并没有本质上的不同,所以你不必过于担心这个主题,只是在回顾这些特性的通用用法。
这很可能是理解起来最不费力的Awk命令部分之一,那就让轻松地开始学习吧。
变量
在各种编程语言里,变量充当存储特定值的容器。一旦你在程序文件中声明了一个变量,程序执行时,就会在内存中分配一块空间来保存你为这个变量指定的值。
定义Awk变量的方法与定义shell变量的方法相同,具体如下:
variable_name=value
在上述的语法规则中:
variable_name:指的是你为变量指定的名称
value:指的是变量存储的具体数值
接下来,让看一些具体的例子:
computer_name=”tecmint.com”
port_no=”22”
email=”admin@tecmint.com”
server=”computer_name”
观察上述的简单实例,在首次定义变量时,将值 tecmint.com 分配给了变量 computer_name。
同样,数字 22 被赋予了变量 port_no,还可以把一个变量的值赋给另一个变量,就像最后一个例子中,将变量 computer_name 的值赋给了变量 server。
如果你还记得,在本系列的第二部分,讨论了字段编辑,当时讨论了 Awk 如何将输入行分割成不同的字段,并使用标准的字段访问操作符 $
来读取这些已解析的字段。也可以使用变量来保存字段的值,具体方法如下。
first_name=$2
second_name=$3
在上述例子中,变量 first_name 被赋予了第二字段的值,而 second_name 则被赋予了第三字段的值。
例如,假设有一个名为 names.txt 的文件,该文件列出了一个应用程序的用户的名单,包括他们的名、姓和性别。可以使用 cat 命令来查看这个文件的内容,操作如下:
$ cat names.txt
接下来,可以使用变量 first_name 和 second_name 来分别保存名单上第一位用户的名和姓氏,具体可以通过执行下面的 Awk 命令来实现:
$ awk '/Aaron/{ first_name=$2 ; second_name=$3 ; print first_name, second_name ; }' names.txt
再让来看一个例子,当你在你的终端中输入命令 uname -a 时,它会显示出你的系统的全部信息。
在输出的第二字段中包含了你的主机名,因此可以将这个主机名存储到一个名为 hostname 的变量里,然后通过 Awk 命令如下打印出来:
$ uname -a
$ uname -a | awk '{hostname=$2 ; print hostname ; }'
数字表达式
在 Awk 语言中,可以通过使用一系列的数值运算符来构建数值表达式,这些运算符包括:
表示乘法
表示加法 / 表示除法
表示减法 % 表示取余(模) ^ 表示乘方(指数)
数值表达式的构成格式为:
$ operand1 operator operand2
在上述表达式中,operand1 和 operand2 可以是数值或者变量的名称,而 operator 则可以是前文提到的任一运算符。
下面是一些示例,展示了如何构建数值表达式:
counter=0
num1=5
num2=10
num3=num2-num1
counter=counter+1
要理解在 Awk 中数值表达式的运用,来看下面的例子,这个例子中用到了一个名为 domains.txt 的文件,这个文件列出了 Tecmint 所持有的所有域名。
news.tecmint.com
tecmint.com
linuxsay.com
windows.tecmint.com
tecmint.com
news.tecmint.com
tecmint.com
linuxsay.com
tecmint.com
news.tecmint.com
tecmint.com
linuxsay.com
windows.tecmint.com
tecmint.com
要查看文件的内容,请使用以下命令:
$ cat domains.txt
如果想计算域 howtoing.com 在文件中出现的次数,可以编写一个简单的脚本来执行此操作,如下所示:
#!/bin/bash
for file in $@; do
if [ -f $file ] ; then
#print out filename
echo "File is: $file"
#print a number incrementally for every line containing tecmint.com
awk '/^tecmint.com/ { counter=counter+1 ; printf "%s\n", counter ; }' $file
else
#print error info incase input is not a file
echo "$file is not a file, please specify a file." >&2 && exit 1
fi
done
#terminate script with exit code 0 in case of successful execution
exit 0
创建脚本后,保存它并使其可执行,当使用文件domains.txt作为输出运行它时,得到以下输出:
$ ./script.sh ~/domains.txt
从脚本的输出来看,domains.txt 文件中有 6 行包含 howtoing.com,以确认您可以手动计算它们。
赋值运算符
接下来,将探讨 Awk 的最后一个特性——赋值运算符。在 Awk 中,有多种赋值运算符,具体包括:
- *= 表示乘法后赋值
- += 表示加法后赋值
- /= 表示除法后赋值
- -= 表示减法后赋值
- %= 表示取余(模)后赋值
- ^= 表示乘方(指数)后赋值
在 Awk 中进行赋值操作的基本语法如下:
$ variable_name=variable_name operator operand
示例:
counter=0
counter=counter+1
num=20
num=num-1
您可以使用上面的赋值运算符来缩短 Awk 中的赋值操作,考虑前面的示例,可以按以下形式执行赋值:
variable_name operator=operand
counter=0
counter+=1
num=20
num-=1
因此,可以使用 += 赋值运算符更改上面刚刚编写的 shell 脚本中的 Awk 命令,如下所示:
#!/bin/bash
for file in $@; do
if [ -f $file ] ; then
#print out filename
echo "File is: $file"
#print a number incrementally for every line containing tecmint.com
awk '/^tecmint.com/ { counter+=1 ; printf "%s\n", counter ; }' $file
else
#print error info incase input is not a file
echo "$file is not a file, please specify a file." >&2 && exit 1
fi
done
#terminate script with exit code 0 in case of successful execution
exit 0