[20170511]sed awk抽取段落技巧.txt

简介: [20170511]sed awk抽取段落技巧.txt --//今天学习了如何使用sed awk抽取文本段落,做一个记录,使用sed我很早就知道,不常用.也做一个记录.

[20170511]sed awk抽取段落技巧.txt

--//今天学习了如何使用sed awk抽取文本段落,做一个记录,使用sed我很早就知道,不常用.也做一个记录.

$ cat aa.txt

1111
2323

=================
this is a test111
this is a test222
-----------------

dsjfdf
sdfdsf

=================
this is a test333
this is a test444
-----------------
121212


--//假设我仅仅需要,有时候开头===,结束----之间的内容.
=================
this is a test111
this is a test222
-----------------

=================
this is a test333
this is a test444
----------------

1.sed方法如下:

D:\IrisDB>sed -n "/^==/,/^--/p" bb.txt
=================
this is a test111
this is a test222
-----------------
=================
this is a test333
this is a test444
-----------------

2.awk方法比较难以理解,顺便学习学习.

D:\IrisDB>gawk "/^====/{flag=1}/^----/{flag=0}flag" bb.txt
=================
this is a test111
this is a test222
=================
this is a test333
this is a test444

--//大概意思是
--//如果查询遇到/^====/ 设置flag=1(你也可以别的字母不一定是flag)
--//    查询遇到/^----/ 设置flag=0,然后显示之间的内容.写成如下也是可以的.

D:\IrisDB>gawk "/^====/{f=1}/^----/{f=0}f" bb.txt
=================
this is a test111
this is a test222
=================
this is a test333
this is a test444

--//对比前面sed就是丢失了结尾的分隔符号,这并重要.^_^.如何保留结束内容一起显示我真不懂.

 

--//昏,上班查询一些文档,sed awk实际上一样.前面的awk语法有点复杂,不好理解.

R:\>gawk "/^==/,/^--/" cc.txt
=================
this is a test111
this is a test222
-----------------
=================
this is a test333
this is a test444
-----------------

目录
相关文章
|
存储 编解码 数据可视化
单细胞分析|Seurat中的跨模态整合
在单细胞基因组学中,新方法“桥接整合”允许将scATAC-seq、scDNAme等技术的数据映射到基于scRNA-seq的参考数据集,借助多组学数据作为桥梁。研究展示了如何将scATAC-seq数据集映射到人类PBMC的scRNA-seq参考,使用10x Genomics的多组学数据集。Azimuth ATAC工具提供了自动化的工作流程,支持在R和网页平台上执行桥接整合。通过加载和预处理不同数据集,映射scATAC-seq数据并进行评估,证明了映射的准确性和细胞类型预测的可靠性。此方法扩展了参考映射框架,促进了不同技术间的互操作性。
|
12月前
|
机器学习/深度学习 存储 算法
决策树和随机森林在机器学习中的应用
在机器学习领域,决策树(Decision Tree)和随机森林(Random Forest)是两种非常流行且强大的分类和回归算法。它们通过模拟人类决策过程,将复杂的数据集分割成易于理解和处理的子集,从而实现对新数据的准确预测。
328 10
|
XML Dubbo Java
【Dubbo3高级特性】「框架与服务」服务的异步调用实践以及开发模式
【Dubbo3高级特性】「框架与服务」服务的异步调用实践以及开发模式
334 0
|
5月前
|
人工智能 Python
[oeasy]python082_变量部分总结_variable_summary
本文介绍了变量的定义、声明、赋值及删除操作,以及Python中的命名规则和常见数据类型。通过示例讲解了字符串与整型的基本用法、类型转换方法和加法运算的区别。此外,还涉及异常处理(try-except)、模块导入(如math和random)及随机数生成等内容。最后总结了实验要点,包括捕获异常、进制转化、变量类型及其相互转换,并简述了编程中AI辅助的应用策略,强调明确目标、分步实施和逐步巩固的重要性。更多资源可在蓝桥、GitHub和Gitee获取。
230 97
|
Linux C# Android开发
.NET Avalonia开源、免费的桌面UI库 - SukiUI
.NET Avalonia开源、免费的桌面UI库 - SukiUI
605 5
|
10月前
|
Oracle 关系型数据库 MySQL
Centos7下图形化部署单点KFS同步工具并将Oracle增量同步到KES
Centos7下图形化部署单点KFS同步工具并将Oracle增量同步到KES
Centos7下图形化部署单点KFS同步工具并将Oracle增量同步到KES
|
11月前
|
存储 JavaScript 前端开发
JavaScript 数据类型详解:基本类型与引用类型的区别及其检测方法
JavaScript 数据类型分为基本数据类型和引用数据类型。基本数据类型(如 string、number 等)具有不可变性,按值访问,存储在栈内存中。引用数据类型(如 Object、Array 等)存储在堆内存中,按引用访问,值是可变的。本文深入探讨了这两种数据类型的特性、存储方式、以及检测数据类型的两种常用方法——typeof 和 instanceof,帮助开发者更好地理解 JavaScript 内存模型和类型检测机制。
378 0
JavaScript 数据类型详解:基本类型与引用类型的区别及其检测方法
|
Kubernetes Java 开发工具
Kubernetes部署项目流程(新手上线新版本服务整个流程)
【8月更文挑战第1天】Kubernetes(k8s)新手上线新版本服务整个流程
308 5
|
机器学习/深度学习 算法 数据挖掘
【数据挖掘】 GBDT面试题:其中基分类器CART回归树,节点的分裂标准是什么?与RF的区别?与XGB的区别?
文章讨论了梯度提升决策树(GBDT)中的基分类器CART回归树的节点分裂标准,并比较了GBDT与随机森林(RF)和XGBoost(XGB)的区别,包括集成学习方式、偏差-方差权衡、样本使用、并行性、最终结果融合、数据敏感性以及泛化能力等方面的不同。
247 1
|
jenkins Java API
jenkins API实践
jenkins API实践

热门文章

最新文章