在信息化浪潮席卷全球的当下,数字化转型已成为各行各业的核心驱动力,而作为这一进程守护者的运维工作,其重要性与日俱增。面对瞬息万变的IT环境,复杂多元的系统架构,以及日益严苛的服务质量要求,高效的自动化工具与脚本已成为运维人员提升工作效率、确保系统稳定性不可或缺的“秘密武器”。有鉴于此,我倾力编撰了这份精心筛选与整理的Shell脚本合集,旨在为广大的运维同行献上一份诚意满满的“运维人福利”,助您在应对日常运维挑战时如虎添翼,从容不迫。
这份脚本合集,犹如一座蕴藏着丰富矿藏的知识宝库,凝结了我在实战运维工作中积累的点滴智慧与宝贵经验。它深度聚焦服务器监控、故障排查、数据备份与恢复、性能调优、自动化部署等运维核心领域,旨在为每一位身处其中的专业人士提供全方位的支持。无论是初涉运维领域的新人,渴望快速掌握实战技巧,还是久经沙场的资深专家,寻求优化现有流程、提升运维效能的新思路,都能在这份合集中找寻到契合自身需求的解决方案。
每一款脚本均经过真实业务场景的反复打磨与严格测试,秉持着简洁高效、易于理解和使用的理念设计。它们不仅具备高度的灵活性与适应性,能够轻松应对各种复杂运维环境下的多样化需求,而且注释详尽,逻辑清晰,旨在成为您日常工作中随时查阅、快速上手的实用指南。无论是自动化执行例行任务,迅速响应突发事件,还是深入挖掘系统瓶颈,优化资源分配,这些脚本都将化身为您的得力助手,使繁复的运维工作变得有条不紊,事半功倍。
我热忱欢迎所有运维同仁自由取阅、广泛分享这份宝贵的Shell脚本资源,将其融入个人的工作实践中,或是作为团队协作、技能培训的参考资料。它们不仅是提升个人技能、优化工作流程的有效工具,更是增进同行间技术交流、知识共享的优质载体。让我们携手共进,充分运用这份脚本合集所蕴含的技术力量,积极推动运维工作的智能化、自动化进程,共同为构建稳定、高效、可靠的信息化系统保驾护航,为企业的数字化转型之路奠定坚实基础。在这个瞬息万变的数字化时代,让我们以匠心独运的运维智慧,驾驭科技之舟,破浪前行,共创辉煌!
今天我们要分析的是:
监控 httpd 的进程数,根据监控情况做相应处理
#!/bin/bash
#计数器函数
check_service()
{
j=0
for i in `seq 1 5`
do
#重启Apache的命令
/usr/local/apache2/bin/apachectl restart 2> /var/log/httpderr.log
#判断服务是否重启成功
if [ $? -eq 0 ] then
break
else
j=$[$j+1] fi
#判断服务是否已尝试重启5次
if [ $j -eq 5 ] then
mail.py exit
fi
done }while :do
n=`pgrep -l httpd|wc -l`
#判断httpd服务进程数是否超过500
if [ $n -gt 500 ] then
/usr/local/apache2/bin/apachectl restart
if [ $? -ne 0 ]
then
check_service
else
sleep 60
n2=`pgrep -l httpd|wc -l`
#判断重启后是否依旧超过500
if [ $n2 -gt 500 ]
then
mail.py exit
fi
fi
fi
#每隔10s检测一次
sleep 10done脚本实现过程:
- 定义计数器函数:
check_service()
:该函数负责在Apache服务无法正常重启时,最多尝试5次重新启动。每次重启失败时,计数器j
递增;达到5次仍未成功时,调用mail.py exit
(假设是一个发送邮件通知的Python脚本,通知服务已退出)。- 在函数内部,首先执行Apache重启命令
/usr/local/apache2/bin/apachectl restart
,并将错误输出重定向到/var/log/httpderr.log
。 - 使用
if [ $? -eq 0 ]
检查重启命令的退出状态(0表示成功)。如果成功,跳出循环;否则,计数器j
加1。 - 判断计数器
j
是否等于5(即已尝试重启5次),若是,则调用mail.py exit
发送邮件通知。
- 主循环:
while :
:创建一个无限循环,持续监控Apache进程数。n=$(pgrep -l httpd|wc -l)
:使用pgrep
命令查找所有名为httpd
的进程,并统计数量,结果存储在变量n
中。if [ $n -gt 500 ]
:检查当前Apache进程数是否超过500。若是,则执行以下操作:
- 重启Apache服务:
/usr/local/apache2/bin/apachectl restart
。 - 使用
if [ $? -ne 0 ]
检查重启命令的退出状态(非0表示失败)。如果失败,则调用check_service
函数尝试最多5次重启。 - 如果重启成功,等待60秒后再次检查进程数(
n2=$(pgrep -l httpd|wc -l)
)。 - 若重启后进程数依然超过500,调用
mail.py exit
发送邮件通知。
sleep 10
:无论是否需要重启服务,循环结束后均暂停10秒,然后再次检查Apache进程数。
如何使用:
- 保存脚本文件:
- 将上述脚本内容保存为一个
.sh
文件,例如apache_monitor.sh
。
- 赋予执行权限:
- 使用命令
chmod +x apache_monitor.sh
为脚本文件添加执行权限。
- 运行脚本:
- 在终端中,使用命令
./apache_monitor.sh
执行脚本。
执行脚本后,系统将进入一个无限循环,每隔10秒检查一次Apache服务的进程数。若进程数超过500,则尝试重启服务。如果重启失败,最多尝试5次。无论重启成功与否,都会在重启后再次检查进程数。若进程数依然过高,将发送邮件通知。通过运行此脚本,您可以及时发现并处理Apache服务进程过多的问题,防止服务器资源耗尽。
如果想上手操作练代码的同学们可以通过阿里云ecs服务器免费试用参与!
入口:新老同学免费试用