AWK进行简单分析文本

简介: AWK进行简单分析文本

AWK 是一种处理文本文件的语言,是一个强大的文本分析工具

基本语法

awk [options] '[pattern] {action}' file

示例

1、使用命令行

cat demo.txt

Hello world!
$ awk '{print}' hello.txt
Hello world!
$ awk -F " " '{print $1}' hello.txt
Hello

说明:

-F选项 指定空格" "作为字段分隔符

$1 分隔后列表索引,从1开始,0是整行

注意'[pattern] {action}' 是单引号

2、使用脚本文件

#运行前
BEGIN {
# 空格分隔
FS=" "
}

#运行中
{
print $1
}
$ awk -f hello.awk hello.txt
Hello

3、多行文件处理示例

demo.txt

name       color  amount
apple red 4
banana yellow 6
strawberry red 3
grape purple 10
apple green 8
plum purple 2
kiwi brown 4
potato brown 9
pineapple yellow 5
# 第三列的值等于2
$ awk -F " " '$3==2 {print $0}' demo.txt
plum purple 2


# 第一列的值以p开头 (不匹配 !~)
$ awk -F " " '$1 ~ /^p/ {print $0}' demo.txt
plum purple 2
potato brown 9
pineapple yellow 5
            </div>
目录
相关文章
|
存储 编译器 C语言
详解C/C++中的static和extern
本文详解了C/C++中`static`和`extern`关键字的用法和区别,通过具体代码示例说明了在不同情境下如何正确使用这两个关键字,以及`extern "C"`在C++中用于兼容C语言库的特殊作用。
472 4
详解C/C++中的static和extern
|
存储 安全 Java
学成在线笔记+踩坑(12)——用户认证
连接用户中心数据库、账号密码认证、验证码认证
学成在线笔记+踩坑(12)——用户认证
|
存储 SQL 人工智能
CCCF专栏 | 加密数据库技术:前沿与展望
本文将从数据安全防护的重大战略需求出发,聚焦数据安全搜索、加密数据库技术等前沿领域,深入探讨加密数据库的发展现状,揭示其设计过程中存在的安全性和性能方面的挑战,并提出未来关于加密数据库建设的一些愿景。
CCCF专栏 | 加密数据库技术:前沿与展望
|
存储 消息中间件 RocketMQ
DLedger —基于 raft 协议的 commitlog 存储库
尊敬的阿里云用户: 您好!为方便您试用开源 RocketMQ 客户端访问阿里云MQ,我们申请了专门的优惠券,优惠券可以直接抵扣金额。请填写下您公司账号信息,点击上图,了解更多哦。 一、DLedger引入目的 在 RocketMQ 4.5 版本之前,RocketMQ 只有 Master/Slave 一种部署方式,一组 broker 中有一个 Master ,有零到多个 Slave,Slave 通过同步复制或异步复制的方式去同步 Master 数据。
13272 104
|
10月前
|
机器学习/深度学习 人工智能 自然语言处理
《剖析Transformer架构:自然语言处理飞跃的幕后英雄》
Transformer架构自2017年提出以来,凭借自注意力机制革新了自然语言处理(NLP)。它摒弃传统RNN的顺序处理方式,实现全局并行计算,大幅提升训练效率。通过多头自注意力机制,Transformer能精准捕捉长距离依赖关系,多维度挖掘语义信息。位置编码赋予其序列顺序感知能力,而大规模预训练则使其具备强大的通用语言能力。Transformer已成为NLP领域的核心驱动力,推动智能语音助手、机器翻译等应用进入新时代。
412 2
|
安全 区块链 数据安全/隐私保护
深入探索区块链技术在金融领域的应用与挑战
本文旨在探讨区块链技术在现代金融领域中的应用前景,分析其带来的机遇与面临的挑战。通过对当前区块链技术的基本原理及其在金融行业的具体应用场景进行深入剖析,本文揭示了区块链技术如何推动金融服务的创新和效率提升。同时,文章也对技术实施过程中可能遇到的法律、安全和隐私等问题进行了探讨,并提出了相应的解决策略。通过综合评估区块链技术的优势与局限,本文为金融行业的从业者和研究者提供了宝贵的参考和指导。
|
监控 安全 测试技术
构建高效精准测试平台:设计与实现全攻略
在软件开发过程中,精准测试是确保产品质量的关键环节。一个高效、精准的测试平台能够自动化测试流程,提高测试覆盖率,缩短测试周期。本文将分享如何设计和实现一个精准测试平台,从需求分析到技术选型,再到具体的实现步骤。
298 0
|
人工智能 自然语言处理 计算机视觉
浙大李玺团队:指代表达理解新方法,ScanFormer粗到细迭代消除视觉冗余
【9月更文挑战第14天】近年来,人工智能的迅猛发展推动了计算机视觉与自然语言处理交叉领域的研究,其中指代表达理解任务备受关注。REC的目标是在图像中根据自然语言描述定位目标对象。然而,现有方法因密集感知图像而导致计算开销大。为此,浙江大学李玺团队提出了ScanFormer,一种迭代感知框架,通过自顶向下的方式逐步提取与语言相关的视觉块,并通过信息性预测丢弃不相关部分,有效减少冗余,提升模型效率。实验表明,ScanFormer在多个基准数据集上表现优异,实现了准确性和效率的良好平衡。不过,它目前仅支持单目标定位,且在某些场景下可能不如其他方法精确。
261 1
|
数据采集 消息中间件 安全
.NET使用分布式网络爬虫框架DotnetSpider快速开发爬虫功能
.NET使用分布式网络爬虫框架DotnetSpider快速开发爬虫功能
286 0
|
存储 Kubernetes Cloud Native
【 云原生 | kubernetes 】- Argo CD 持续交付
ArgoCD 是一个 GitOps 代理,它将 Git 存储库中描述的应用程序的状态与 Kubernetes 集群中的部署同步。
【 云原生 | kubernetes 】- Argo CD 持续交付