在信息化浪潮席卷全球的当下,数字化转型已成为各行各业的核心驱动力,而作为这一进程守护者的运维工作,其重要性与日俱增。面对瞬息万变的IT环境,复杂多元的系统架构,以及日益严苛的服务质量要求,高效的自动化工具与脚本已成为运维人员提升工作效率、确保系统稳定性不可或缺的“秘密武器”。有鉴于此,我倾力编撰了这份精心筛选与整理的Shell脚本合集,旨在为广大的运维同行献上一份诚意满满的“运维人福利”,助您在应对日常运维挑战时如虎添翼,从容不迫。
这份脚本合集,犹如一座蕴藏着丰富矿藏的知识宝库,凝结了我在实战运维工作中积累的点滴智慧与宝贵经验。它深度聚焦服务器监控、故障排查、数据备份与恢复、性能调优、自动化部署等运维核心领域,旨在为每一位身处其中的专业人士提供全方位的支持。无论是初涉运维领域的新人,渴望快速掌握实战技巧,还是久经沙场的资深专家,寻求优化现有流程、提升运维效能的新思路,都能在这份合集中找寻到契合自身需求的解决方案。
每一款脚本均经过真实业务场景的反复打磨与严格测试,秉持着简洁高效、易于理解和使用的理念设计。它们不仅具备高度的灵活性与适应性,能够轻松应对各种复杂运维环境下的多样化需求,而且注释详尽,逻辑清晰,旨在成为您日常工作中随时查阅、快速上手的实用指南。无论是自动化执行例行任务,迅速响应突发事件,还是深入挖掘系统瓶颈,优化资源分配,这些脚本都将化身为您的得力助手,使繁复的运维工作变得有条不紊,事半功倍。
我热忱欢迎所有运维同仁自由取阅、广泛分享这份宝贵的Shell脚本资源,将其融入个人的工作实践中,或是作为团队协作、技能培训的参考资料。它们不仅是提升个人技能、优化工作流程的有效工具,更是增进同行间技术交流、知识共享的优质载体。让我们携手共进,充分运用这份脚本合集所蕴含的技术力量,积极推动运维工作的智能化、自动化进程,共同为构建稳定、高效、可靠的信息化系统保驾护航,为企业的数字化转型之路奠定坚实基础。在这个瞬息万变的数字化时代,让我们以匠心独运的运维智慧,驾驭科技之舟,破浪前行,共创辉煌!
今天我们要分析的是:
并发从数台机器中获取 hostname,并记录返回信息花费的时长,重定向到一个文件 hostname.txt 中,在全部完成后输出花费时长最短的那台机器的 CPU 信息。
#!bin/bash
# 所有主机,以空格分隔
ALL_HOSTS=(IP 地址 IP 地址)
for host in ${ALL_HOSTS[*]}
do
{
start_time=$(date +'%s')
ssh $host "hostname" &>/dev/null
sleep 2
stop_time=$(date +'%s')
time_consuming=$((stop_time-start_time))
echo "$host: $time_consuming" >>hostname.txt
}&
done
wait
host=$(sort -n -k 2 hostname.txt | head -1 | awk -F':' '{print $1}')
ssh $host "top -b -n 1"
脚本结构与变量定义
Bash
1#!/bin/bash 2# 所有主机,以空格分隔 3ALL_HOSTS=(IP 地址 IP 地址)
#!/bin/bash
:这是“shebang”行,指定使用bash shell执行此脚本。ALL_HOSTS
:定义一个数组,包含所有待查询的服务器IP地址。
并发执行命令并记录响应时间
Bash
1for host in ${ALL_HOSTS[*]} 2do 3{ 4start_time=$(date +'%s') 5ssh $host "hostname" &>/dev/null 6sleep 2 7stop_time=$(date +'%s') 8time_consuming=$((stop_time-start_time)) 9echo "$host: $time_consuming" >>hostname.txt 10}& 11done 12wait
- 对于
ALL_HOSTS
数组中的每一台服务器:
- 记录当前时间(以秒为单位)到
start_time
变量。 - 使用
ssh
命令并发(通过在命令末尾添加&
符号)执行远程命令hostname
,并将标准输出和错误输出重定向到/dev/null
(忽略输出)。 - 等待2秒(可能用于确保SSH连接稳定,实际应用中可能需要调整或移除)。
- 再次记录当前时间到
stop_time
变量。 - 计算响应时间(
stop_time
减去start_time
),结果存储在time_consuming
变量中。 - 将主机名和响应时间(格式为
$host: $time_consuming
)追加到hostname.txt
文件中。
wait
命令:等待所有并发的SSH命令完成。
找出响应时间最短的服务器并输出其CPU信息
Bash
1host=$(sort -n -k 2 hostname.txt | head -1 | awk -F':' '{print $1}') 2ssh $host "top -b -n 1"
- 使用
sort
命令按hostname.txt
文件的第二列(响应时间)进行升序排序。 head -1
选取排序后的第一行(即响应时间最短的服务器记录)。awk -F':' '{print $1}'
以冒号为分隔符,提取第一列(主机名)。- 结果存储在变量
host
中,代表响应时间最短的服务器。 - 最后,使用
ssh
命令连接到响应时间最短的服务器,执行top -b -n 1
命令,获取并显示该服务器的实时CPU使用情况(-b
表示批处理模式,-n 1
表示采样一次)。
如何使用
- 修改
ALL_HOSTS
数组:将实际的服务器IP地址替换到ALL_HOSTS
数组中,确保以空格分隔。 - 赋予脚本执行权限:
- Bash
1chmod +x your_script.sh
- 运行脚本:
- Bash
1./your_script.sh
脚本会并发地从所有指定的服务器获取hostname,并记录响应时间到hostname.txt
文件。完成后,它将显示响应时间最短的服务器的CPU使用情况。通过分析hostname.txt
文件,可以了解到各台服务器的响应速度,有助于识别网络或性能瓶颈。
如果想上手操作练代码的同学们可以通过阿里云ecs服务器免费试用参与!
入口:新老同学免费试用