动态服务器监控与通知系统

简介: 【4月更文挑战第30天】

》》》》》魏红斌带你学shell脚本《《《《《


更多shell脚本学习点击个人主页


作为一个资深程序猿,我将带领您从零开始,一步步踏上运维之旅,无论您是否拥有现成的服务器,都将学会如何轻松购买、部署,并通过编写及应用精心设计的Shell脚本,解决实际工作中遇到的问题。这些脚本不仅源自真实的业务场景,经历了反复实践与严格测试,确保了其简洁高效、易于理解且便于使用。更重要的是,我们将全程免费分享,并深度解析背后原理,助您深入理解并灵活运用,每一款脚本均经过真实业务场景的反复打磨与严格测试,秉持着简洁高效、易于理解和使用的理念设计,无偿提供并且提供相关解析过程,让读者能更深入了解相关内容

无服务器的朋友们

让我们先从选购并部署服务器开始。只需简单三步,即可拥有您的专属云服务器:

  1. 访问ECS官网:点击链接直达阿里云ECS网站:ECS选择网址。这是您获取高质量云服务器的第一站。
  2. 选择并购买:在琳琅满目的服务器配置中,挑选符合您需求的那一款,一键下单,完成支付。整个过程犹如在线购物般便捷。
  3. 进入ECS控制台:支付成功后,您将被引导至ECS管理控制台。在这里,您可以全面掌控您的服务器资源,后续的所有运维操作都将在此展开。

已有服务器的朋友们

如果您已拥有ECS实例,那么请直接登录ECS管理控制台在左侧导航栏中,依次选择“实例与镜像” > “实例”,确保您已定位到目标资源所在的资源组和地域。接下来,在实例列表中找到待连接的实例,点击操作列下的“远程连接”,选择“通过Workbench远程连接”并点击“立即登录”。

登录实例

无论是新购还是已有服务器,接下来都需要进行实例登录。这里支持多种认证方式,以最常见的“密码认证”为例:

  • 输入用户名(通常为rootecs-user)。
  • 接着,输入登录密码。如果您忘记了密码,无需担忧,您可以在ECS实例详情页面查询,或者通过“更改密码”功能进行修改。

编写与运行Shell脚本

成功登录后,您将看到一个熟悉的命令行界面——这就是您的运维主战场。现在,键入vim test.sh,我们便进入了文本编辑模式,准备创建第一个Shell脚本。

按下键盘上的i键,进入插入模式,此刻您可以自由地复制粘贴今天要学习的脚本代码,粘贴后按ecs后,按:wq保存脚本,可以用./ test.sh或者sh test.sh进行脚本执行。

今天我们要学习的脚本是(脚本内容直接复制粘贴即可):

#!/bin/bash
# 动态服务器监控与通知系统
# 此脚本用于监控服务器的关键指标,并在异常时发送通知
# 1. 定义监控指标阈值
CPU_THRESHOLD=90
MEM_THRESHOLD=80
DISK_THRESHOLD=90
# 2. 定义通知方式(例如:发送邮件)
NOTIFY_EMAIL="admin@example.com"
NOTIFY_SUBJECT="Server Monitoring Alert"
# 3. 获取服务器关键指标
cpu_usage=$(top -bn1 | grep "Cpu(s)" | awk '{print $2 + $4}')
mem_usage=$(free | grep Mem | awk '{print $3/$2 * 100.0}')
disk_usage=$(df -h / | awk '$NF=="/"{printf "%.2f", $5}')
# 4. 检查CPU使用率是否超过阈值
if (( $(echo "$cpu_usage > $CPU_THRESHOLD" | bc -l) )); then
    notify_message="CPU usage is above $CPU_THRESHOLD%. Current usage: $cpu_usage%"
    send_notification "$notify_message"
fi
# 5. 检查内存使用率是否超过阈值
if (( $(echo "$mem_usage > $MEM_THRESHOLD" | bc -l) )); then
    notify_message="Memory usage is above $MEM_THRESHOLD%. Current usage: $mem_usage%"
    send_notification "$notify_message"
fi
# 6. 检查磁盘使用率是否超过阈值
if (( $(echo "$disk_usage > $DISK_THRESHOLD" | bc -l) )); then
    notify_message="Disk usage is above $DISK_THRESHOLD%. Current usage: $disk_usage%"
    send_notification "$notify_message"
fi
# 7. 定义发送通知的函数
send_notification() {
    local message=$1
    echo "$message" | mail -s "$NOTIFY_SUBJECT" "$NOTIFY_EMAIL"
}
# 脚本结束
echo "Server monitoring completed."

逐行解析

  1. 脚本开头,指定使用bash解释器。
  2. 注释说明脚本的功能和用途。
  3. 定义CPU、内存和磁盘使用率的阈值。
  4. 定义通知方式,这里使用邮件通知,并设置邮件接收者和主题。
  5. 使用top命令获取CPU使用率。
  6. 使用free命令获取内存使用率。
  7. 使用df命令获取根目录的磁盘使用率。
  8. 检查CPU使用率是否超过阈值,如果超过则发送通知。
  9. 检查内存使用率是否超过阈值,如果超过则发送通知。
  10. 检查磁盘使用率是否超过阈值,如果超过则发送通知。
  11. 定义send_notification函数,用于发送邮件通知。
  12. 脚本执行完毕,输出完成信息。

总结

此脚本是一个动态服务器监控与通知系统,它监控服务器的CPU、内存和磁盘使用情况,并在任何一项指标超过预定义阈值时发送邮件通知。脚本的创新之处在于它结合了系统监控和邮件通知功能,使得管理员可以即时得知服务器性能问题并采取相应的措施。此外,脚本使用了函数来封装邮件发送逻辑,增强了代码的可读性和可维护性。

如果想上手操作练代码的同学们可以通过阿里云ecs服务器免费试用参与!

入口:新老同学免费试用

相关实践学习
2分钟自动化部署人生模拟器
本场景将带你借助云效流水线Flow实现人生模拟器小游戏的自动化部署
7天玩转云服务器
云服务器ECS(Elastic Compute Service)是一种弹性可伸缩的计算服务,可降低 IT 成本,提升运维效率。本课程手把手带你了解ECS、掌握基本操作、动手实操快照管理、镜像管理等。了解产品详情: https://www.aliyun.com/product/ecs
目录
相关文章
|
运维 监控
WGCLOUD运维监控方案 - 如何设置主机10分钟内恢复正常就不进行提醒
这个,我们只要把agent上报时间改成10分钟就好了
|
运维 监控 安全
启用控制面日志采集及告警提升系统稳定性
服务网格的控制面组件扮演的一个重要角色是负责推送网格的规则配置到数据面的Sidecar代理或者网关中。如果用户配置的网格规则内容存在一些冲突导致推送失败, 因此代理或者网关就接收不到最新的配置内容。 因为代理或网关在不重启的情况下, 仍然可以使用已经接收到的配置继续运行, 但是一旦这些Pod重启, 很有可能导致Sidecar代理或网关启动失败。 在很多实际的客户场景中, 经常出现用户误配置引发的网关或代理不可用问题, 因此启用控制面的日志告警, 及时发现问题、解决问题势在必行。 ASM支持采集控制平面日志和日志告警,例如采集ASM控制平面向数据平面Sidecar推送配置的相关日志。
274 0
启用控制面日志采集及告警提升系统稳定性
|
缓存 Java Spring
报警系统QuickAlarm之报警执行器的设计与实现
根据前面一篇总纲的博文,将整体结构划分为了四大块,本文则主要目标集中在第一块,报警执行器(AlarmExecute)的设计与加载上了 主要的关注点无外乎 定义-》加载-》实现逻辑三块了: 1.AlarmExecute 的接口定义 2.如何加载用户自定义的AlarmExecute 3.AlarmExecute的内部实现
346 0
报警系统QuickAlarm之报警执行器的设计与实现
|
弹性计算 监控 机器人
用自定义监控实现 GPU 异常状况的检查与报警
## 应用场景 ## * 阿里云的云监控已原生支持 GPU 实例,可参考:[云监控实现GPU云服务器的GPU监控和报警](https://yq.aliyun.com/articles/610219) * 小概率场景中,GPU 卡会处于异常状态( 例如因[显存校验失败](https://docs.
1656 0
|
弹性计算 监控
【新功能发布】动态应用分组发布,实现从云资源生产到监控报警配置的全自动化
动态应用分组发布,实现从客户云资源生产到监控报警配置的全自动化
2413 0