实时监控系统资源利用率

简介: 【4月更文挑战第30天】

》》》》》魏红斌带你学shell脚本《《《《《


更多shell脚本学习点击个人主页


作为一个资深程序猿,我将带领您从零开始,一步步踏上运维之旅,无论您是否拥有现成的服务器,都将学会如何轻松购买、部署,并通过编写及应用精心设计的Shell脚本,解决实际工作中遇到的问题。这些脚本不仅源自真实的业务场景,经历了反复实践与严格测试,确保了其简洁高效、易于理解且便于使用。更重要的是,我们将全程免费分享,并深度解析背后原理,助您深入理解并灵活运用,每一款脚本均经过真实业务场景的反复打磨与严格测试,秉持着简洁高效、易于理解和使用的理念设计,无偿提供并且提供相关解析过程,让读者能更深入了解相关内容

无服务器的朋友们

让我们先从选购并部署服务器开始。只需简单三步,即可拥有您的专属云服务器:

  1. 访问ECS官网:点击链接直达阿里云ECS网站:ECS选择网址。这是您获取高质量云服务器的第一站。
  2. 选择并购买:在琳琅满目的服务器配置中,挑选符合您需求的那一款,一键下单,完成支付。整个过程犹如在线购物般便捷。
  3. 进入ECS控制台:支付成功后,您将被引导至ECS管理控制台。在这里,您可以全面掌控您的服务器资源,后续的所有运维操作都将在此展开。

已有服务器的朋友们

如果您已拥有ECS实例,那么请直接登录ECS管理控制台在左侧导航栏中,依次选择“实例与镜像” > “实例”,确保您已定位到目标资源所在的资源组和地域。接下来,在实例列表中找到待连接的实例,点击操作列下的“远程连接”,选择“通过Workbench远程连接”并点击“立即登录”。

登录实例

无论是新购还是已有服务器,接下来都需要进行实例登录。这里支持多种认证方式,以最常见的“密码认证”为例:

  • 输入用户名(通常为rootecs-user)。
  • 接着,输入登录密码。如果您忘记了密码,无需担忧,您可以在ECS实例详情页面查询,或者通过“更改密码”功能进行修改。

编写与运行Shell脚本

成功登录后,您将看到一个熟悉的命令行界面——这就是您的运维主战场。现在,键入vim test.sh,我们便进入了文本编辑模式,准备创建第一个Shell脚本。

按下键盘上的i键,进入插入模式,此刻您可以自由地复制粘贴今天要学习的脚本代码,粘贴后按ecs后,按:wq保存脚本,可以用./ test.sh或者sh test.sh进行脚本执行。

今天我们要学习的脚本是(脚本内容直接复制粘贴即可):

#!/bin/bash
# SystemMonitor.sh
# 该脚本用于实时显示系统的CPU、内存、磁盘和网络使用情况
# 定义一个函数来显示系统信息
display_system_info() {
    # 获取CPU信息
    cpu_info=$(top -bn1 | grep "Cpu(s)" | awk '{print $2 + $4}')
    cpu_usage=$(printf "%.2f" $(echo "scale=2; $cpu_info / 100" | bc))
    # 获取内存信息
    mem_info=$(free | grep Mem | awk '{print $3/$2 * 100.0}')
    mem_usage=$(printf "%.2f" $(echo "scale=2; $mem_info" | bc))
    # 获取磁盘使用情况
    disk_usage=$(df -h / | awk '$NF=="/"{printf "%.2f", $5}')
    # 获取网络使用情况
    net_info=$(netstat -i | grep -E '^[0-9]+:' | awk '{print $10}' | cut -d'/' -f2)
    net_send=$(echo "$net_info" | grep -oP '^\d+')
    net_recv=$(echo "$net_info" | grep -oP '\d+$')
    # 显示信息
    echo "CPU Usage: $cpu_usage%"
    echo "Memory Usage: $mem_usage%"
    echo "Disk Usage: $disk_usage%"
    echo "Network Send: $net_send KB/s"
    echo "Network Receive: $net_recv KB/s"
    echo "------------------------"
    sleep 1  # 暂停1秒,然后再次执行函数以持续监控
    display_system_info
}
# 开始执行函数,显示系统信息
display_system_info

逐行解析:

  1. #!/bin/bash - 指定脚本使用Bash shell执行。

2-4. 注释部分 - 提供了脚本的名称和简短描述。

6-33. display_system_info() 函数 - 定义了一个函数,用于收集并显示系统信息。

  • cpu_info=$(top -bn1 | grep "Cpu(s)" | awk '{print $2 + $4}') - 使用top命令获取CPU使用率,并通过grepawk提取相关信息。
  • cpu_usage=$(printf "%.2f" $(echo "scale=2; $cpu_info / 100" | bc)) - 计算CPU使用率并格式化输出。
  • mem_info=$(free | grep Mem | awk '{print $3/$2 * 100.0}') - 使用free命令获取内存使用情况,并计算内存使用率。
  • mem_usage=$(printf "%.2f" $(echo "scale=2; $mem_info" | bc)) - 格式化内存使用率输出。
  • disk_usage=$(df -h / | awk '$NF=="/"{printf "%.2f", $5}') - 使用df命令获取根目录的磁盘使用情况。
  • net_info=$(netstat -i | grep -E '^[0-9]+:' | awk '{print $10}' | cut -d'/' -f2) - 使用netstat命令获取网络接口的发送和接收数据。
  • net_send=$(echo "$net_info" | grep -oP '^\d+')net_recv=$(echo "$net_info" | grep -oP '\d+$') - 从网络信息中提取发送和接收的数据量。
  • echo 语句 - 显示收集到的系统信息。
  • sleep 1 - 暂停1秒,然后再次调用display_system_info函数,实现实时监控。
  1. display_system_info - 调用上面定义的函数,开始执行脚本。

总结:

SystemMonitor.sh 是一个用于实时监控Linux系统资源利用率的Shell脚本。它通过调用内置命令如top, free, df, 和 netstat 来收集CPU、内存、磁盘和网络的使用情况,并格式化输出到终端。脚本使用了一个递归函数来不断更新和显示这些信息,从而实现实时监控的效果。这个脚本对于系统管理员或需要了解系统运行状态的用户来说非常有用。

如果想上手操作练代码的同学们可以通过阿里云ecs服务器免费试用参与!

入口:新老同学免费试用

相关实践学习
2分钟自动化部署人生模拟器
本场景将带你借助云效流水线Flow实现人生模拟器小游戏的自动化部署
7天玩转云服务器
云服务器ECS(Elastic Compute Service)是一种弹性可伸缩的计算服务,可降低 IT 成本,提升运维效率。本课程手把手带你了解ECS、掌握基本操作、动手实操快照管理、镜像管理等。了解产品详情: https://www.aliyun.com/product/ecs
目录
相关文章
|
6月前
CPU过高问题定位
CPU过高问题定位
61 0
|
6月前
|
监控 Java 索引
cpu使用率过高和jvm old占用过高排查过程
cpu使用率过高和jvm old占用过高排查过程
157 2
|
1月前
|
缓存 运维 监控
CPU被打满/CPU 100%:高效应对策略与技术干货分享
【10月更文挑战第3天】在信息技术高速发展的今天,无论是开发人员、运维人员还是数据分析师,都可能遇到CPU被打满(即CPU使用率达到100%)的情况。这不仅会影响系统的响应速度,严重时甚至会导致服务中断。本文将从诊断、分析与解决三个方面,详细介绍处理CPU 100%问题的技术干货。
84 3
|
13天前
|
Prometheus 监控 Cloud Native
系统监控负载
【10月更文挑战第19天】
|
3月前
|
监控 Java Linux
CPU被打满/CPU 100%:高效诊断与优化策略
【8月更文挑战第28天】在日常的工作与学习中,遇到CPU使用率飙升至100%的情况时,往往意味着系统性能受到严重影响,甚至可能导致程序响应缓慢或系统崩溃。本文将围绕这一主题,分享一系列高效诊断与优化CPU使用的技术干货,帮助大家快速定位问题并恢复系统性能。
194 1
|
5月前
|
监控 算法 Java
CPU突然被打满的原因(全方位分析)
CPU突然被打满的原因(全方位分析)
|
6月前
|
监控 测试技术
【亮剑】理解CPU负载对服务器稳定性的重要性,并提供了诊断和解决CPU负载过高问题的步骤
【4月更文挑战第30天】本文阐述了理解CPU负载对服务器稳定性的重要性,并提供了诊断和解决CPU负载过高问题的步骤:1) 使用监控工具分析CPU使用率和系统负载;2) 深入排查运行队列、进程占用、系统调用和硬件状态;3) 根据排查结果进行代码优化、调整进程优先级或限制CPU使用率,必要时升级硬件。建议建立监控体系,定期性能测试,并持续优化以保证服务器高效运行。
217 1
|
6月前
|
Linux
linux内存使用率过高分析
linux内存使用率过高分析
57 0
|
6月前
|
运维 Kubernetes Docker
k8s运维—系统磁盘资源占用率过高
k8s运维—系统磁盘资源占用率过高
137 0
|
Java
分析JAVA应用CPU占用过高的问题
分析JAVA应用CPU占用过高的问题
67 0