在信息化浪潮席卷全球的当下,数字化转型已成为各行各业的核心驱动力,而作为这一进程守护者的运维工作,其重要性与日俱增。面对瞬息万变的IT环境,复杂多元的系统架构,以及日益严苛的服务质量要求,高效的自动化工具与脚本已成为运维人员提升工作效率、确保系统稳定性不可或缺的“秘密武器”。有鉴于此,我倾力编撰了这份精心筛选与整理的Shell脚本合集,旨在为广大的运维同行献上一份诚意满满的“运维人福利”,助您在应对日常运维挑战时如虎添翼,从容不迫。
这份脚本合集,犹如一座蕴藏着丰富矿藏的知识宝库,凝结了我在实战运维工作中积累的点滴智慧与宝贵经验。它深度聚焦服务器监控、故障排查、数据备份与恢复、性能调优、自动化部署等运维核心领域,旨在为每一位身处其中的专业人士提供全方位的支持。无论是初涉运维领域的新人,渴望快速掌握实战技巧,还是久经沙场的资深专家,寻求优化现有流程、提升运维效能的新思路,都能在这份合集中找寻到契合自身需求的解决方案。
每一款脚本均经过真实业务场景的反复打磨与严格测试,秉持着简洁高效、易于理解和使用的理念设计。它们不仅具备高度的灵活性与适应性,能够轻松应对各种复杂运维环境下的多样化需求,而且注释详尽,逻辑清晰,旨在成为您日常工作中随时查阅、快速上手的实用指南。无论是自动化执行例行任务,迅速响应突发事件,还是深入挖掘系统瓶颈,优化资源分配,这些脚本都将化身为您的得力助手,使繁复的运维工作变得有条不紊,事半功倍。
我热忱欢迎所有运维同仁自由取阅、广泛分享这份宝贵的Shell脚本资源,将其融入个人的工作实践中,或是作为团队协作、技能培训的参考资料。它们不仅是提升个人技能、优化工作流程的有效工具,更是增进同行间技术交流、知识共享的优质载体。让我们携手共进,充分运用这份脚本合集所蕴含的技术力量,积极推动运维工作的智能化、自动化进程,共同为构建稳定、高效、可靠的信息化系统保驾护航,为企业的数字化转型之路奠定坚实基础。在这个瞬息万变的数字化时代,让我们以匠心独运的运维智慧,驾驭科技之舟,破浪前行,共创辉煌!
今天我们要分析的是:
监控 100 台服务器磁盘利用率脚本
#!/bin/bash
HOST_INFO=host.info
for IP in $(awk '/^[^#]/{print $1}' $HOST_INFO); do
USER=$(awk -v ip=$IP 'ip==$1{print $2}' $HOST_INFO)
PORT=$(awk -v ip=$IP 'ip==$1{print $3}' $HOST_INFO)
TMP_FILE=/tmp/disk.tmp
ssh -p $PORT $USER@$IP 'df -h' > $TMP_FILE
USE_RATE_LIST=$(awk 'BEGIN{OFS="="}/^\/dev/{print $NF,int($5)}' $TMP_FILE)
for USE_RATE in $USE_RATE_LIST; do
PART_NAME=${USE_RATE%=*}
USE_RATE=${USE_RATE#*=}
if [ $USE_RATE -ge 80 ]; then
echo "Warning: $PART_NAME Partition usage $USE_RATE%!"
fi
done
done
脚本结构与变量定义
Bash
1#!/bin/bash 2HOST_INFO=host.info
#!/bin/bash
:这行是“shebang”,告诉系统此文件应使用bash shell来执行。HOST_INFO=host.info
:定义变量HOST_INFO
,其值为host.info
。这个文件(假设位于脚本同一目录下)应包含要监控的服务器列表及其相关登录信息。
读取服务器列表并循环处理
Bash
1for IP in $(awk '/^[^#]/{print $1}' $HOST_INFO); do
- 使用awk命令从
host.info
文件中提取出非注释行(即以非#
字符开头的行)的第一列(即IP地址)。对每个IP地址进行一次循环。
提取对应服务器的用户和端口信息
Bash
1USER=$(awk -v ip=$IP 'ip==$1{print $2}' $HOST_INFO) 2PORT=$(awk -v ip=$IP 'ip==$1{print $3}' $HOSTInfo)
- 对于当前循环中的IP地址,使用awk命令从
host.info
文件中找到对应行,分别提取第二列(用户)和第三列(端口)的信息,将结果分别赋值给变量USER
和PORT
。
远程执行命令并保存输出
Bash
1TMP_FILE=/tmp/disk.tmp 2ssh -p $PORT $USER@$IP 'df -h' > $TMP_FILE
- 定义临时文件
TMP_FILE
,用于存储远程命令的输出。 - 使用ssh命令以指定的用户、端口连接到目标服务器,并执行
df -h
命令(显示磁盘空间使用情况,单位为人类可读格式)。命令输出重定向到TMP_FILE
。
解析磁盘利用率信息
Bash
1USE_RATE_LIST=$(awk 'BEGIN{OFS="="}/^\/dev/{print $NF,int($5)}' $TMP_FILE)
- 使用awk命令解析
TMP_FILE
中的内容:
BEGIN{OFS="="}
:设置输出字段分隔符为等号(=)。/^\/dev/{print $NF,int($5)}
:对于以/dev/
开头的行(表示磁盘分区),打印最后一列(分区名)和第五列(已用空间百分比,转换为整数形式)。结果存储在变量USE_RATE_LIST
中,格式如:partition_name=use_rate%
。
检查并输出警告信息
Bash
1for USE_RATE in $USE_RATE_LIST; do 2PART_NAME=${USE_RATE%=*} 3USE_RATE=${USE_RATE#*=} 4if [ $USE_RATE -ge 80 ]; then 5echo "Warning: $PART_NAME Partition usage $USE_RATE%!" 6fi 7done
- 遍历
USE_RATE_LIST
中的每个磁盘利用率信息。 - 使用bash的参数扩展功能提取出分区名(
PART_NAME=${USE_RATE%=*}
)和利用率(USE_RATE=${USE_RATE#*=}
)。 - 如果利用率大于等于80%,则输出警告信息。
如何使用
- 准备
host.info
文件:按照如下格式创建或编辑host.info
文件,包含您要监控的服务器列表及其登录信息: - Code
1# IP 地址 用户名 端口 2192.168.1.1 user1 22 3192.168.1.2 user2 22 4...
- 赋予脚本执行权限:
- Bash
1chmod +x your_script.sh
- 运行脚本:
- Bash
1./your_script.sh
脚本会依次连接每台服务器,获取磁盘利用率信息,并在本地输出磁盘利用率超过80%的警告消息。根据这些警告,可以及时了解哪些服务器的磁盘使用率较高,需要进行清理或扩容操作。
如果想上手操作练代码的同学们可以通过阿里云ecs服务器免费试用参与!
入口:新老同学免费试用