Shell 编程(五):文本三剑客之 sed(二)

本文涉及的产品
云数据库 RDS MySQL,集群系列 2核4GB
推荐场景:
搭建个人博客
RDS MySQL Serverless 基础系列,0.5-2RCU 50GB
RDS MySQL Serverless 高可用系列,价值2615元额度,1个月
简介: sed(Stream Editor)是一种流编辑器,sed 是对标准输出或文件逐行进行处理。sed 会在编辑器处理数据以前基于预先提供的一组规则来编辑数据流。能够根据命令来处理数据流中的数据,这些命令要么从命令行中输入,要么存储在一个命令文本文件中。

利用 sed 查找文件内容

练习

  1. 打印 /etc/passwd 中第 20 行的内容
> sed -n '20p' /etc/passwd
chrony:x:996:993::/var/lib/chrony:/sbin/nologin


  1. 打印 /etc/passwd 中从第 8 行开始,到第 15 行结束的内容
> sed -n '8,15p' /etc/passwd
halt:x:7:0:halt:/sbin:/sbin/halt
mail:x:8:12:mail:/var/spool/mail:/sbin/nologin
operator:x:11:0:operator:/root:/sbin/nologin
games:x:12:100:games:/usr/games:/sbin/nologin
ftp:x:14:50:FTP User:/var/ftp:/sbin/nologin
nobody:x:65534:65534:Kernel Overflow User:/:/sbin/nologin
dbus:x:81:81:System message bus:/:/sbin/nologin
systemd-coredump:x:999:996:systemd Core Dumper:/:/sbin/nologin


  1. 打印 /ete/passwd 中人第 8 行开始,然后 +5 行结束的内容
> sed -n '8,+5p' /ete/passwd
halt:x:7:0:halt:/sbin:/sbin/halt
mail:x:8:12:mail:/var/spool/mail:/sbin/nologin
operator:x:11:0:operator:/root:/sbin/nologin
games:x:12:100:games:/usr/games:/sbin/nologin
ftp:x:14:50:FTP User:/var/ftp:/sbin/nologin
nobody:x:65534:65534:Kernel Overflow User:/:/sbin/nologin


  1. 打印 /etc/passwd 中开头匹配 root 字符串的内容
> sed -n '/^root/p' /etc/passwd
root:x:0:0:root:/root:/bin/bash


  1. 打印 /etc/passwd 中第 8 行开始,到含有 /sbin/nologin 的内容
> sed -n '8,/\/sbin\/nologin/p'  /etc/passwd
halt:x:7:0:halt:/sbin:/sbin/halt
mail:x:8:12:mail:/var/spool/mail:/sbin/nologin


  1. 打印 /etc/passwd 中开头为 root 的行开始,到开头为 halt 的行结束的内容
> sed -n '/^root/,/^halt/p' /etc/passwd
root:x:0:0:root:/root:/bin/bash
bin:x:1:1:bin:/bin:/sbin/nologin
daemon:x:2:2:daemon:/sbin:/sbin/nologin
adm:x:3:4:adm:/var/adm:/sbin/nologin
lp:x:4:7:lp:/var/spool/lpd:/sbin/nologin
sync:x:5:0:sync:/sbin:/bin/sync
shutdown:x:6:0:shutdown:/sbin:/sbin/shutdown
halt:x:7:0:halt:/sbin:/sbin/halt


  1. 打印 /etc/passwd 中第一个包含 /bin/bash 内容的行开始,到第 5 行结束的内容
> sed -n '/\/bin\/bash/,5p' /etc/passwd
root:x:0:0:root:/root:/bin/bash
bin:x:1:1:bin:/bin:/sbin/nologin
daemon:x:2:2:daemon:/sbin:/sbin/nologin
adm:x:3:4:adm:/var/adm:/sbin/nologin
lp:x:4:7:lp:/var/spool/lpd:/sbin/nologin


实战

处理一个类似 MySql 配置文件 my.cnf 的文本,示例如下; 编写脚本实现以下功能:输出文件有几个段,并且针对每个段可以统计配置参数总个数;

my.cnf 如下

预想输出:

client 2 
mysqld 19
...
[client]
#password = your_password
port    = 3306
socket    = /tmp/mysql.sock
[mysqld]
port    = 3306
socket    = /tmp/mysql.sock
datadir = /www/server/data
default_storage_engine = InnoDB
performance_schema_max_table_instances = 400
table_definition_cache = 400
skip-external-locking
key_buffer_size = 32M
max_allowed_packet = 100G
table_open_cache = 128
sort_buffer_size = 768K
net_buffer_length = 4K
read_buffer_size = 768K
read_rnd_buffer_size = 256K
myisam_sort_buffer_size = 8M
thread_cache_size = 16
query_cache_size = 16M
tmp_table_size = 32M
sql-mode=NO_ENGINE_SUBSTITUTION,STRICT_TRANS_TABLES
explicit_defaults_for_timestamp = true
#skip-name-resolve
max_connections = 500
max_connect_errors = 100
open_files_limit = 65535
log-bin=mysql-bin
binlog_format=mixed
server-id = 1
expire_logs_days = 10
slow_query_log=1
slow-query-log-file=/www/server/data/mysql-slow.log
long_query_time=3
#log_queries_not_using_indexes=on
early-plugin-load = ""
innodb_data_home_dir = /www/server/data
innodb_data_file_path = ibdata1:10M:autoextend
innodb_log_group_home_dir = /www/server/data
innodb_buffer_pool_size = 128M
innodb_log_file_size = 64M
innodb_log_buffer_size = 16M
innodb_flush_log_at_trx_commit = 1
innodb_lock_wait_timeout = 50
innodb_max_dirty_pages_pct = 90
innodb_read_io_threads = 2
innodb_write_io_threads = 2
[mysqldump]
quick
max_allowed_packet = 500M
[mysql]
no-auto-rehash
[myisamchk]
key_buffer_size = 32M
sort_buffer_size = 768K
read_buffer = 2M
write_buffer = 2M
[mysqlhotcopy]
interactive-timeout


代码

#!/bin/bash
FILE_NAME=$(pwd)'/my.cnf'
function get_all_segments {
  sed -n '/\[.*\]/p' $FILE_NAME | sed -e 's/\[//g' -e 's/\]//g'
}
function count_items_in_segment {
  items=`sed -n "/\[.*$1.*\]/,/\[.*\]/p" $FILE_NAME | grep -v "^#" | grep -v "^$"|grep -v "\[.*\]"`
#  echo $items
  index=0
  for item in $items
  do
    index=`expr $index + 1`
  done
  echo $index
}
for segment in `get_all_segments`
do
echo $segment `count_items_in_segment $segment`
done


利用 sed 删除特定内容

查询命令 含义
1d 删除第 1 行内容
1,10d 删除 1 行到 10 行的内容
1,+5d 删除 1 行到 6 行的内容
/pattern1/d 删除每行中匹配到 pattern1 的行内容
/pattern1/,/pattern2/d 删除匹配到 pattern1 的行直到匹配到 pattern2 的所有行内容
/pattern1/,10d 删除匹配到 pattern1 的行到 10 行的所有行内容
10,/pattern1/d 删除第 10 行直到匹配到 pattern1 的所有行内容

例子

  1. 删除配置文件 /etc/nginx 中的所有注释行和空行
> sed -i '/[:blank:]*#/d;/^$/d' nginx


  1. 在配置文件 /etc/nginx 中所有不以 # 开头的行前面添加 * 符号,注意:以 # 开头的行不添加
> sed -i 's/^[^#]/\*&/g' nginx


  1. 删除 /etc/passwd 中的第 15 行
> sed -i '15d' passwd


  1. 删除 /etc/passwd 中第 5 行到以 ftp 开头的所有行的内容
> sed -i '5,/^ftp/d' passwd


利用 sed 修改文件内容

编辑命令 含义
1s/old/new/ 替换第1 行内容 old 为 new
1,10s/old/new/ 替换 1 行到 10 行的内容 old 为 new
1,+5s/old/new/ 替换 1 行到 6 行的内容 old 为 new
/pattern1/s/old/new/ 替换匹配到 pattern1 的行内容 old 为 new
/pattern1/,/pattern2/s/old/new/ 替换匹配到 pattern1 的行直到匹配到 pattern2 的所有行内容 old 为 new
/pattern1/, 10s/old/new/ 替换匹配到 pattern1 的行到 10 行的所有行内容 old 为 new
10,/pattern 1/s/old/new/ 替换第 10 行直到匹配到 pattern1 的所有行内容 old 为 new

例子

  1. 修改 /etc/passwd 中第 1 行中第 1 个 root 为 ROOT
> sed -i '1s/root/ROOT/' passwd 
> cat passwd


  1. 修改 /etc/passwd 中第 5 行到第 10 行中所有的 /sbin/nologin 为 /bin/bash
> sed -i '5,10s/\/sbin\/nologin/\/bin\/bash/g' passwd
> cat passwd


  1. 修改 /etc/passwd 中匹配到 /sbin/nologin 的行,将匹配到行中的 login 改为大写的 LOGIN
> sed -i '/\/sbin\/nologin/s/login/LOGIN/g' passwd
> cat passwd


  1. 修改 /etc/passwd 中从匹配到以 root 开头的行,到匹配到行中包含 mail 的所有行。修改内为将这些所有匹配到的行中的 bin 改为 HADOOP
> sed -i '/^root/,/mail/s/bin/HADOOP/g' passwd 
> cat passwd


  1. 修改 /etc/passwd 中从匹配到以 root 开头的行,到第 15 行中的所有行,修改内容为将这些行中的 nologin 修改为 SPARK
> sed -i '/^root/,15s/nologin/SPARK/g' passwd
> cat passwd


  1. 修改 /etc/passwd 中从第 15 行开始,到匹配到以 yarn 开头的所有行,修改内容为将这些行中的 bin 换位 BIN
> sed -i '15,/^yarn/s/bin/BIN/g' passwd 
> cat passwd


利用 sed 追加文件内容

追加用法 含义
a 在匹配行后面追加
i 在匹配行前面追加
r 将文件内容追加到匹配行后面
w 将匹配行写入指定文件
  1. passwd 文件匹配到 /bin/bash 的行后面追加 “Insert Line For /bin/bash Behind”
> sed -i '/\/bin\/bash/a Insert Line For /bin/bash Behind' passwd
> cat passwd


  1. passwd 文件每一行前面都追加 “Insert Line Before Every Line”
> sed -i 'Insert Line Before Every Line' passwd
> cat passwd


  1. 将 /etc/vconsole.conf 文件内容追加到 passwd 文件中特定行后面,匹配以 ftp 开头的行,到第 18 行的所有行
> sed -i '/^ftp/,18r /etc/vconsole.conf' passwd
> cat passwd


  1. 将 passwd 文件从第 10 行开始,到匹配到 hdfs 开头的所有行内容追加到 /tmp/sed-1.txt
> sed -i '10,/^hdfs/w /tmp/sed-1.txt' passwd
> cat /tmp/sed-1.txt


相关实践学习
如何快速连接云数据库RDS MySQL
本场景介绍如何通过阿里云数据管理服务DMS快速连接云数据库RDS MySQL,然后进行数据表的CRUD操作。
全面了解阿里云能为你做什么
阿里云在全球各地部署高效节能的绿色数据中心,利用清洁计算为万物互联的新世界提供源源不断的能源动力,目前开服的区域包括中国(华北、华东、华南、香港)、新加坡、美国(美东、美西)、欧洲、中东、澳大利亚、日本。目前阿里云的产品涵盖弹性计算、数据库、存储与CDN、分析与搜索、云通信、网络、管理与监控、应用服务、互联网中间件、移动服务、视频服务等。通过本课程,来了解阿里云能够为你的业务带来哪些帮助     相关的阿里云产品:云服务器ECS 云服务器 ECS(Elastic Compute Service)是一种弹性可伸缩的计算服务,助您降低 IT 成本,提升运维效率,使您更专注于核心业务创新。产品详情: https://www.aliyun.com/product/ecs
目录
相关文章
|
4月前
|
Unix Shell Linux
LeetCode刷题 Shell编程四则 | 194. 转置文件 192. 统计词频 193. 有效电话号码 195. 第十行
本文提供了几个Linux shell脚本编程问题的解决方案,包括转置文件内容、统计词频、验证有效电话号码和提取文件的第十行,每个问题都给出了至少一种实现方法。
LeetCode刷题 Shell编程四则 | 194. 转置文件 192. 统计词频 193. 有效电话号码 195. 第十行
|
4月前
|
Shell Linux
Linux shell编程学习笔记30:打造彩色的选项菜单
Linux shell编程学习笔记30:打造彩色的选项菜单
|
2月前
|
运维 监控 Shell
深入理解Linux系统下的Shell脚本编程
【10月更文挑战第24天】本文将深入浅出地介绍Linux系统中Shell脚本的基础知识和实用技巧,帮助读者从零开始学习编写Shell脚本。通过本文的学习,你将能够掌握Shell脚本的基本语法、变量使用、流程控制以及函数定义等核心概念,并学会如何将这些知识应用于实际问题解决中。文章还将展示几个实用的Shell脚本例子,以加深对知识点的理解和应用。无论你是运维人员还是软件开发者,这篇文章都将为你提供强大的Linux自动化工具。
|
3月前
|
Shell
Shell编程(下)
Shell编程(下)
115 1
|
3月前
|
Shell Linux Windows
Shell编程(上)
Shell编程(上)
54 1
|
3月前
|
Shell Linux 开发工具
|
3月前
|
监控 Unix Shell
shell脚本编程学习
【10月更文挑战第1天】shell脚本编程
89 12
|
4月前
|
Shell Linux
Linux shell编程学习笔记82:w命令——一览无余
Linux shell编程学习笔记82:w命令——一览无余
|
4月前
|
人工智能 监控 Shell
常用的 55 个 Linux Shell 脚本(包括基础案例、文件操作、实用工具、图形化、sed、gawk)
这篇文章提供了55个常用的Linux Shell脚本实例,涵盖基础案例、文件操作、实用工具、图形化界面及sed、gawk的使用。
839 2
|
4月前
|
存储 Unix Shell
shell脚本编程基础
【9月更文挑战第4天】
61 12