软件测试|Linux三剑客之awk命令详解

简介: 软件测试|Linux三剑客之awk命令详解

image.png

简介

awk 是一种强大的文本处理工具,在 Unix 和类 Unix 系统中广泛使用。它允许您在文本文件中进行复杂的数据处理和格式化输出。awk 的名字是根据它的三位创始人AhoWeinbergerKernighan姓氏的首字母命名的。本文将详细介绍 awk 命令的基本用法和一些常见的用例。

awk 基本语法

awk 命令的基本语法如下:

awk 'pattern { action }' input_file
  • pattern:用于指定需要匹配的条件,可以是文本字符串或正则表达式。
  • { action }:在匹配到指定 pattern 的行上执行的动作。
  • input_file:要处理的输入文件名。

常见用法

  1. 打印整个文件:
awk '{ print }' input_file

上述命令将打印 input_file 文件的所有行。

  1. 打印特定列:
awk '{ print $n }' input_file

此命令将打印 input_file 文件的第n列。

  1. 打印符合条件的行:
awk '/pattern/ { print }' input_file

该命令将打印 input_file 文件中包含 "pattern" 的所有行。

  1. 使用字段分隔符:
awk -F',' '{ print $1 }' input_file

此命令将使用逗号作为字段分隔符,并打印 input_file 文件的第一个字段。

内置变量

awk 提供了一些内置变量,方便您在处理文本时使用。以下是一些常用的内置变量:

  • $0:当前行的内容。
  • $1、$2、$3...`:当前行的第一个、第二个、第三个字段等。
  • NR:当前行的行号。
  • NF:当前行的字段数。

示例用法

  1. 计算文件中数字的总和:
awk '{ sum +=$1 } END { print sum}' number.txt 

####
30

上述命令将计算 numbers.txt文件中第一列所有数字的总和,并打印结果。

  1. 查找最长的行:
awk 'length > max_length { max_length = length; longest_line = $0 } END { print longest_line }' text.txt

######
my favorite food is jiaozi

此命令将在 text.txt 文件中查找最长的行,并打印该行。

  1. 使用自定义分隔符:
awk -F':' '{ print $1 }' /etc/passwd

##########################
root
daemon
bin
sys
sync
games
man
lp
mail
news
uucp
proxy

该命令将使用冒号作为字段分隔符,并打印 /etc/passwd 文件的第一个字段(用户名)。

awk文件中读取脚本

awk 允许将脚本命令存储到文件中,然后再在命令行中引用,比如:

cat awk.sh
{
   
   print $1 "'s home directory is " $6}
$ awk -F: -f awk.sh  /etc/passwd
root's home directory is /root
daemon's home directory is /usr/sbin
bin's home directory is /bin
sys's home directory is /dev
sync's home directory is /bin
games's home directory is /usr/games
man's home directory is /var/cache/man
lp's home directory is /var/spool/lpd
mail's home directory is /var/mail
news's home directory is /var/spool/news
uucp's home directory is /var/spool/uucp
proxy's home directory is /bin
www-data's home directory is /var/www
backup's home directory is /var/backups
list's home directory is /var/list
irc's home directory is /var/run/ircd
gnats's home directory is /var/lib/gnats
nobody's home directory is /nonexistent
systemd-network's home directory is /run/systemd
systemd-resolve's home directory is /run/systemd
systemd-timesync's home directory is /run/systemd
messagebus's home directory is /nonexistent
syslog's home directory is /home/syslog
_apt's home directory is /nonexistent
muller's home directory is /home/muller

awk.sh 脚本文件会使用 print 命令打印 /etc/passwd 文件的主目录数据字段(字段变量 $6),以及 userid 数据字段(字段变量 $1)。注意,在程序文件中,也可以指定多条命令,只要一条命令放一行即可,之间不需要用分号。

awk BEGIN关键字

awk 中还可以指定脚本命令的运行时机。默认情况下,awk 会从输入中读取一行文本,然后针对该行的数据执行程序脚本,但有时可能需要在处理数据前运行一些脚本命令,这就需要使用 BEGIN 关键字。

BEGIN 会强制 awk 在读取数据前执行该关键字后指定的脚本命令,例如:

awk 'BEGIN {print "The fruits.txt Contents:"}
> {print $0}' fruits.txt
The fruits.txt Contents:
apple
APPLE
banana
BANANA
ORANGE
orange
grape
Grape
good
Good
apple
orange
orange
orange

可以看到,这里的脚本命令中分为 2 部分,BEGIN 部分的脚本指令会在 awk 命令处理数据前运行,而真正用来处理数据的是第二段脚本命令。

awk END关键字

和 BEGIN 关键字相对应,END 关键字允许我们指定一些脚本命令,awk 会在读完数据后执行它们,例如:

awk 'BEGIN {print "player contents:"}
> {print $0}
> END {print "end of file"}' player.txt
player contents:
Muller is a German football player.
Messi is a Argentina football player.
Mbappé is a French football player.

总结

awk 命令是一种强大的文本处理工具,可用于在文本文件中进行复杂的数据处理和格式化输出。通过使用模式匹配、动作和内置变量,可以高效地处理和分析大量文本数据。在本文中,我们介绍了 awk 命令的基本用法和一些常见的用例,希望这能帮助大家更好地利用 awk 命令进行文本处理。

相关文章
|
26天前
|
Unix Linux 程序员
Linux文本搜索工具grep命令使用指南
以上就是对Linux环境下强大工具 `grep` 的基础到进阶功能介绍。它不仅能够执行简单文字查询任务还能够处理复杂文字处理任务,并且支持强大而灵活地正则表达规范来增加查询精度与效率。无论您是程序员、数据分析师还是系统管理员,在日常工作中熟练运用该命令都将极大提升您处理和分析数据效率。
103 16
|
18天前
|
Linux
linux命令—stat
`stat` 是 Linux 系统中用于查看文件或文件系统详细状态信息的命令。相比 `ls -l`,它提供更全面的信息,包括文件大小、权限、所有者、时间戳(最后访问、修改、状态变更时间)、inode 号、设备信息等。其常用选项包括 `-f` 查看文件系统状态、`-t` 以简洁格式输出、`-L` 跟踪符号链接,以及 `-c` 或 `--format` 自定义输出格式。通过这些选项,用户可以灵活获取所需信息,适用于系统调试、权限检查、磁盘管理等场景。
|
3月前
|
监控 Linux 网络安全
Linux命令大全:从入门到精通
日常使用的linux命令整理
667 13
|
4月前
|
Linux 网络安全 数据安全/隐私保护
使用Linux系统的mount命令挂载远程服务器的文件夹。
如此一来,你就完成了一次从你的Linux发车站到远程服务器文件夹的有趣旅行。在这个技术之旅中,你既探索了新地方,也学到了如何桥接不同系统之间的距离。
555 21
|
4月前
|
JSON 自然语言处理 Linux
linux命令—tree
tree是一款强大的Linux命令行工具,用于以树状结构递归展示目录和文件,直观呈现层级关系。支持多种功能,如过滤、排序、权限显示及格式化输出等。安装方法因系统而异常用场景包括:基础用法(显示当前或指定目录结构)、核心参数应用(如层级控制-L、隐藏文件显示-a、完整路径输出-f)以及进阶操作(如磁盘空间分析--du、结合grep过滤内容、生成JSON格式列表-J等)。此外,还可生成网站目录结构图并导出为HTML文件。注意事项:使用Tab键补全路径避免错误;超大目录建议限制遍历层数;脚本中推荐禁用统计信息以优化性能。更多详情可查阅手册mantree。
linux命令—tree
|
2月前
|
Linux 网络安全 开发工具
技术栈:这50条最常用的 Linux 命令你一定要会!
建议多在终端中实践,遇到不懂的命令就用 man 或 --help 了解详情!
394 0
|
4月前
|
监控 Linux
Linux系统中使用df命令详解磁盘使用情况。
`df`命令是Linux系统管理员和用户监控和管理磁盘空间使用的重要工具。掌握它的基本使用方法和选项可以帮助在必要时分析和解决空间相关问题。简洁但功能丰富,`df`命令确保了用户可以快速有效地识别和管理文件系统的空间使用情况。
265 13
|
2月前
|
安全 Linux Shell
Linux系统中sudo命令的高效运用技巧。
用户可以通过sudo -l来列出自己目前可执行的命令列表,这有助于用户了解自己的权限范围。
118 0
|
2月前
|
监控 Linux Shell
linux命令
常用 Linux 命令汇总
|
4月前
|
Unix Linux
linux命令—cd
`cd` 命令是 Linux/Unix 系统中用于切换工作目录的基础命令。支持相对路径与绝对路径,常用选项如 `-L` 和 `-P` 分别处理符号链接的逻辑与物理路径。实际操作中,可通过 `cd ..` 返回上级目录、`cd ~` 回到家目录,或利用 `cd -` 在最近两个目录间快速切换。结合 Tab 补全和 `pwd` 查看当前路径,能显著提升效率。此外,需注意特殊字符路径的正确引用及脚本中绝对路径的优先使用。