编程入门(七)之【Linux进阶操作AWK】

简介: 编程入门(七)之【Linux进阶操作AWK】

🔥前言

首先我们要了解什么是AWK:

Awk是一种用于文本处理和数据提取的编程语言。它通常用于对结构化文本数据进行扫描和处理。Awk语言是根据其三位创始人Alfred Aho、Peter Weinberger和Brian Kernighan的姓氏首字母命名的。Awk提供了强大的文本处理功能,包括模式匹配、提取数据、格式化输出等。

为什么用AWK

Awk语言被用于处理一些文本文件、日志文件等,对数据进行分析和处理,不用加载整个文件,而是逐行进行加载,逐行进行处理。

如何使用AWK

Awk程序由模式(pattern)和动作(action)组成,根据模式匹配相应的数据行,并执行相应的动作。

AWK实际操作

根据AWK的使用介绍,我们在Linux系统中来进行AWK操作,首先准备一txt文件:

101,labixiaoxin,CEO
102,xiaoming,CFO
103,xzs,dagongzai
104,zhangsan,CTO
105,shenlong,CMO
106,xiaozhupeiqi,COO

新建文件:

展示文件内容方便后面的AWK操作:

🚀使用AWK进行取文件行

1、根据指定行号获取

awk 'NR==2' yu.txt

🔥NR 行号-------用于显示行号与指定获取行号

2、根据行号范围获取

awk 'NR>=2 && NR<=4'  yu.txt

🔥 &&

awk 'NR==2 || NR==4' yu.txt

🔥 ||

awk 'NR==2,NR==4' yu.txt

🔥 范围符号

🚀根据AWK指定内容获取

类似于grep筛选语句

1、指定内容获取

awk '/xzs/' yu.txt

2、指定内容范围获取(用于对日志文件时间段的获取)

awk '/101/,/105/' yu.txt

🚀使用AWK进行取文件列

🔥取列格式:

数据源 | awk ‘{动作}’ 数据源文件

示例如下:

1、取ls -l 命令中的第一列和第三列

ls -l | awk '{print $1,$3}'

2、取ls -l 每一行数据和第四列数据 每一行附上行号

ls -l | awk '{print NR,$0,$4}

3、取第一列和最后一列

ls -l | awk '{print $1,$NF}'

🔥取列分割

awk默认识别以空格或者连续空格,或者tab键作为分割符,若要用其他分割符号 :/需要用-F指定:数据源|awk -F ‘分隔符’ ‘{动作}’ 数据源

实例:

1、取出 第一列和第三列,并按列对齐

默认识别空格符不能得到需求

awk '{print $1,$3}' /etc/passwd | column -t

加上分割识别符

awk -F, '{print $1,$3}' yu.txt | column -t

2、提取IP地址信息

ifconfig 查看ip位置

进行筛选:ifconfig | awk '/eth0/,/inet/' | awk 'NR == 2' | awk '{print $2}'

🚀正则表达式

正则使用 --表达式 (建议切割符号,尽量唯一,左右边界唯一)

.*? 0~多个字符

+字符连续出现

^以xxx内容开头

$以内容结尾

[]字符或者[abcz] a或者b或者c或者z

| 字符串或者 abc|z abc或者z

示例:提取下列echo ' inet 10.0.0.200/24 brd 10.0.0.255 scope global ens32' >ip.txt 文本中的ip信息

原方法:利用管道提取两次

awk '{print $2}' ip.txt | awk -F'/' '{print $1}'

正则表达式:

awk -F '[ /]+' '{print $3}' ip.txt

综合示例

1、awk完整格式:支持正则表达式

2、awk -F’分隔符’ ‘条件{动作}’ 数据源

3、条件:关于行的操作 找谁? 根据行号|内容找 找指定行

动作:关于列的操作 干啥? 打印print列操作{} 指定列

示例:

取出/etc/passwd中的 第一行中的第一列和第三列

awk -F':' 'NR==1{print $1,$3}' /etc/passwd

awk 包含符号 ~ 不包含!~

示例:

找到第三列包含1或者2开头的行 /etc/passwd

awk -F':' '$3 ~ /[^12]/{print $1,$3}' /etc/passwd

过滤出 /etc/passwd 第三列以0或者3结尾的行,显示第一列和第三列内容

awk -F: '$3 ~ /[03]$/{print $1,$3}' /etc/passwd

⭐️⭐️⭐️总结

1、awk格式

awk -F'分隔符' '可选条件{可选动作}' 数据源

默认分割符号 空格或者连续空格 或者TAB按键

条件 找谁?找行? 如果没有条件 对所有行操作

动作 干啥? print 打印 如果没有就是显示整行

2、awk支持的符号

1 &&  # 与   
  ||  # 逻辑或者   
  ,   # 范围符号
2     # /内容/     
3 {} # 动作符号    
  NR # 行号   Nunber of Record  #记录行 
  $0  一整行     $1 第一列  $3   第三列  
  $NF # Number of Field 最后一个字段 
4  ~   # 包含符号           
   !~  # 不包含符号

3、awk支持正则表达式

目录
相关文章
|
7天前
|
存储 运维 Linux
Linux磁盘精准缩容:操作详解与技巧
在Linux系统管理中,有效的磁盘空间优化对于维护系统性能至关重要。本文将深入探讨如何在Linux环境下安全地进行磁盘缩容,帮助你合理调整存储资源,确保系统高效运行。跟随本篇的步骤,一起优化你的Linux系统磁盘空间!
|
19天前
|
Linux 网络安全 开发工具
linux 常用命令【编程必备】
linux 常用命令【编程必备】
30 4
|
20天前
|
小程序 Linux
【编程小实验】利用Linux fork()与文件I/O:父进程与子进程协同实现高效cp命令(前半文件与后半文件并行复制)
这个小程序是在文件IO的基础上去结合父子进程的一个使用,利用父子进程相互独立的特点实现对数据不同的操作
|
20天前
|
缓存 网络协议 算法
【Linux系统编程】深入剖析:四大IO模型机制与应用(阻塞、非阻塞、多路复用、信号驱动IO 全解读)
在Linux环境下,主要存在四种IO模型,它们分别是阻塞IO(Blocking IO)、非阻塞IO(Non-blocking IO)、IO多路复用(I/O Multiplexing)和异步IO(Asynchronous IO)。下面我将逐一介绍这些模型的定义:
|
26天前
|
Linux 网络安全 开发工具
Linux 管理远程会话 screen:掌握终端的多任务操作
`Linux screen` 命令让多任务管理变得更简单,尤其在SSH连接远程服务器时。创建新会话如`screen -S backup`,查看会话`screen -ls`,退出`exit`。高级功能包括直接在会话中运行命令,如`screen vim memo.txt`,会话共享以协同工作,以及通过`screen -r`或`-D -r`重新连接或强制恢复断开的会话。提高效率,确保任务不间断运行。
14 1
|
1月前
|
存储 Linux BI
Linux 三剑客 grep、sed、awk
Linux三剑客`grep`、`sed`和`awk`是强大的文本处理工具。`grep`用正则表达式搜索匹配行;`sed`是流式编辑器,处理文本流而不直接修改原文件;`awk`则用于灵活的文本分析和报告生成。例如,`grep`可查找匹配模式,`sed`可以删除文件内容,而`awk`能提取特定字段。通过组合使用,它们能高效解决复杂文本任务。
29 1
|
20天前
|
Linux
Linux部署03---ls命令入门 ls直接用命令是列出目录下的内容,ls命令等同于双击打开文件夹,FinalShell默认的是在home目录下,工作目录
Linux部署03---ls命令入门 ls直接用命令是列出目录下的内容,ls命令等同于双击打开文件夹,FinalShell默认的是在home目录下,工作目录
|
20天前
|
Linux
Linux02---命令基础 Linux命令基础, ls命令入门,ls命令参数和选项,命令行是一种以纯字符操作系统的方式,command命令本身,options命令的细节行为,parameter命令的
Linux02---命令基础 Linux命令基础, ls命令入门,ls命令参数和选项,命令行是一种以纯字符操作系统的方式,command命令本身,options命令的细节行为,parameter命令的
|
22天前
|
安全 固态存储 Linux
服务器linux操作系统重装的完整流程-傻瓜式教学
服务器linux操作系统重装的完整流程-傻瓜式教学
|
23天前
|
监控 Unix Linux
Linux中AWK命令的高级应用与案例分析
Linux中AWK命令的高级应用与案例分析