流编辑器:sed|学习笔记

简介: 快速学习流编辑器:sed

开发者学堂课程【Linux 文本管理入门:流编辑器:sed】学习笔记,与课程紧密联系,让用户快速学习知识。

课程地址https://developer.aliyun.com/learning/course/790


流编辑器:sed

内容简介:

一:工具简介

二:工具使用

三:常用场景

一:工具简介

SED的英文全称是Stream EDitor,它是一个简单而强大的文本解析转换工具,在1973-1974年期间由贝尔实验室的LeeE. McMahon开发。今天,它已经运行在所有的主流操作系统上了。

McMahon创建了一个通用的行编辑器,最终变成为了SED,SED的很多语法和特性都借鉴了ed编辑器。设计之初,它就已经支持正则表达式,SED可以从文件中接受类似于管道的输入,也可以接受来自标准输入流的输入,最强大地方是,内部实现里类似管道的处理方式。

SED由自由软件基金组织(FSF)开发和维护并且随着GNU/Linux进行分发,因此,通常它也称作GNU SED.对于新手来说,SED的语法看起来可能有些神秘,但是,一旦掌握了它的语法,就可以只用几行代码去解决非常复杂的任务,这就是SED的魅力所在。需要注意的是:Sed并不会改变源文件的内容。这是因为sed内部维护了缓冲区的绿故,每次操作都是在缓冲区中的。

l 处理流程

image.png

l 命令

² 命令基本格式

[address[.address]][!]action[arguments]

定位( address)和动作(action)

对于输入的每行,检是否符合第一个命令的定位信息,若且换排的动作,反之不执行,接着检查第二个命令,在正常情况下,检查完脚本中的所有命令后,会将处理的当前行输出。

l 定位

² 如何定位

定位可以是行号,下面的例子表示动作在第二行上执行:2

定位也可以是正则表达式,用‘’/表达式/”表示,下面的例子表示匹配所有行:

/^$/

² 两个定位

使用“,‘’隔开的两个位置,表示范围(闭区间)。下例表示动作在第二行到第六行都要执行:2,6

第二行,到第一个空行:

2,/^$/

最后一行:

使用“$”表示

l 几个主要动作

² 替换s/ pattern/ replacement/ flags

Pattern匹配的正则表达式

replacement碴换字符串

flags:n第几次出现时执行

g全替换(換筠行中所有的)

p打印

以下示例将,red替换成green

s/red/green/5

s/red/green/g

s/red/green/p

二:工具使用

l 插入

插入到当前行之前,text为要插入的内容,定位只能有1个。

[address]i text

示例,在第二行之前,插入:

sed"2i This line is inserted by sed"text1

l 追加

插入到当前行之后,text为要插入的内容,定位只能有1个。

[address]a text

示例,在第二行之后,插入:

sed*2a This line is appended by sed"text1

l 语法

² 两种形式

Send[-n] [‘command’][file...]

Send[-n][-f scriptfile][file...]

² -n

只输出有p命令指定的行

三:常用场景

l 批量替换

◆场景

假设你有一个xm格式的数据集,存放的是地震的数据信息,但其中的日期格式是yyyy-mm-dd格式的,现在需要将其转换为mmdy格式。

◆结果

Sed-n's^[0-9]\{4\}-([0-9]\,2\}-\([0-9]\{1,2\}\)^23M1/p’s

相关文章
|
11月前
|
自然语言处理 搜索推荐 前端开发
语镜VocaMirror——基于sensevoice、cosyvoice和qwen模型实现与“自身声音”对话
语镜 VocaMirror 是一个创新的对话系统,灵感来源于汤姆猫游戏和亲人语音克隆项目,旨在让用户与自己的声音进行对话。系统融合了语音识别、自然语言处理及个性化语音合成技术,提供趣味互动、心理治疗辅助及多功能扩展等应用。用户可通过 Gradio 界面轻松使用,实现语音转文本、对话生成及个性化语音回复等功能。
818 4
语镜VocaMirror——基于sensevoice、cosyvoice和qwen模型实现与“自身声音”对话
|
Ubuntu Java Linux
如何检查 Java 版本是否兼容
要检查Java版本是否兼容,可在命令行输入“java -version”查看当前安装的Java版本,然后对比目标应用所需的Java版本,确保其满足要求。
866 1
|
10月前
|
Devops Shell 网络安全
git使用之如何将一套代码同时推送至github|gitee|gitcode|gitlab等多个仓库-含添加ssh-优雅草央千澈完美解决-提供整体提交代码
git使用之如何将一套代码同时推送至github|gitee|gitcode|gitlab等多个仓库-含添加ssh-优雅草央千澈完美解决-提供整体提交代码
453 16
git使用之如何将一套代码同时推送至github|gitee|gitcode|gitlab等多个仓库-含添加ssh-优雅草央千澈完美解决-提供整体提交代码
|
机器学习/深度学习 人工智能 算法
人工智能与医疗健康:AI如何改变生命科学
【10月更文挑战第31天】人工智能(AI)正深刻改变医疗健康和生命科学领域。本文探讨AI在蛋白质结构预测、基因编辑、医学影像诊断和疾病预测等方面的应用,及其对科研进程、医疗创新、服务效率和跨学科融合的深远影响。尽管面临数据隐私和伦理等挑战,AI仍有望为医疗健康带来革命性变革。
433 30
|
12月前
|
机器学习/深度学习 人工智能 自然语言处理
深入理解深度学习中的卷积神经网络(CNN)
深入理解深度学习中的卷积神经网络(CNN)
523 10
|
12月前
|
数据采集 API 开发者
淘宝商品详情数据接口调用,商城上货实战案例(仅供参考)
本案例介绍了如何利用淘宝开放平台API实现商品信息同步至个人或第三方商城的完整流程。首先需注册淘宝开放平台账号并创建应用,获取API密钥。接着,使用Python代码调用API获取商品详情,经过数据清洗整理后上传至目标商城。最后,通过设置定时任务确保商品信息的及时更新,保证商城商品信息的准确性与时效性。
|
机器学习/深度学习 数据采集 人工智能
AI在医疗:深度学习在医学影像诊断中的最新进展
【10月更文挑战第26天】近年来,深度学习技术在医学影像诊断中的应用日益广泛,通过训练大量医学影像数据,实现对疾病的准确诊断。例如,卷积神经网络(CNN)已成功用于识别肺癌、乳腺癌等疾病。深度学习不仅提高了诊断准确性,还缩短了诊断时间,提升了患者体验。然而,数据隐私、数据共享和算法透明性等问题仍需解决。未来,AI将在医学影像诊断中发挥更大作用,成为医生的得力助手。
698 0
|
定位技术 vr&ar 内存技术
|
自然语言处理 Java 测试技术
序列化性能之巅:使用Fury替换Protobuf/Flatbuffers实现10倍加速
问题背景Protobuf/Flatbuffers是业界广泛使用的序列化库,服务于大量的业务场景。但随着业务场景的复杂化,Protobuf/Flatbuffers逐渐不能满足性能需求开始成为系统瓶颈,在这种情况下,用户不得不手写大量序列化逻辑来进行极致性能优化,但这带来了三个问题:大量字段手写序列化逻辑冗长易出错;手写重复序列化逻辑开发效率低下;难以处理发送端和接收端字段变更的前后兼容性问题;这里将
4976 0
序列化性能之巅:使用Fury替换Protobuf/Flatbuffers实现10倍加速