Linux 性能监控之CPU&内存&I/O监控Shell脚本2

简介: Linux 性能监控之CPU&内存&I/O监控Shell脚本2

Linux性能监控之CPU&内存&I/O监控Shell脚本2

 


思路:

捕获数据->停止捕获数据->提取数据

备注:一些命令的输出,第一次记录的数据是自重启到当前时间的平均值,所以,如果采用循环的方式不断重复开启命令,获取的数据可能不太准确,所以,这里采用开启命令后,一次性捕获需要的数据。

 

(一)捕获数据

用法:sh capture.sh arg1 arg2

参数说明:arg1为采样频率,arg2为采样时长,单位都为秒

例子:2秒采集一次数据,采样时长10秒,共采样5

sh capture.sh 2 10

 

capture.sh内容如下:

#!/bin/bash

count=$(($2/$1))

echo $count

rm -f top.txt

rm -f vmstat.txt

rm -f iostat.txt

 

{ top -bd $1 -n $count >> top.txt; }&

{ vmstat -t -n -S K $1 $count >> vmstat.txt; }&

{ iostat -kx $1 $count >> iostat.txt; }&

 

wait

exit 0

说明:并发执行采集数据命令

 

(二)停止捕获数据

用法:sh stop.sh

说明:如果停止压测时还没到命令自动退出时间,可执行该脚本,停止数据捕获

 

stop.sh脚本内容如下:

#!/bin/bash

killall top

killall vmstat

killall iostat

exit 0

 

(三)提取数据

用法:sh analyze.sh agr1 arg2 arg3 arg4 arg5

参数说明:agr1agr2agr3分别为capture中指定的存储文件,默认分别为top.txtvmstat.txt,iostat.txt,arg4为网卡接口,arg需要采集的进程(COMMAND)

例子:

sh analyze.sh top.txt vmstat.txt iostat.txt eth1 netns

 

analyze.sh内容如下:

#!/bin/bash

#获取要监控的本地服务器IP地址

IP=`ifconfig $4 | grep "inet addr" | cut -f 2 -d ":" | cut -f 1 -d " "`

echo "IP地址:"$IP

 

#获取cpu总核数

cpu_num=`grep -c "model name" /proc/cpuinfo`

echo "cpu总核数:"$cpu_num

printf "\n"

 

# 1、获取CPU利用率

printf "获取cpu利用率\n"

printf "cpu_user\tcpu_system\tcpu_idle\tcpu_iowait\ttime\n"

 

record_num=`grep Cpu $1| wc -l`

for((i=1;i<=$record_num;i++))

do

#获取时间

time=`grep "load average" $1 | sed -n ${i}"p" | awk '{print $3}'`

#echo "当前时间"$time

 

#获取用户空间占用CPU百分比

cpu_user=`grep Cpu $1 | awk '{print $2}' |sed -n ${i}"p"| cut -f 1 -d "%"`

#echo "用户空间占用CPU百分比:"$cpu_user

 

#获取内核空间占用CPU百分比

cpu_system=`grep Cpu $1 | awk '{print $3}' |sed -n ${i}"p" | cut -f 1 -d "%"`

#echo "内核空间占用CPU百分比:"$cpu_system

 

#获取空闲CPU百分比

cpu_idle=`grep Cpu $1 | awk '{print $5}' |sed -n ${i}"p" | cut -f 1 -d "%"`

#echo "空闲CPU百分比:"$cpu_idle

 

#获取等待输入输出占CPU百分比

cpu_iowait=`grep Cpu $1 | awk '{print $3}' |sed -n ${i}"p" | cut -f 1 -d "%"`

#echo "等待输入输出占CPU百分比:"$cpu_iowait

#echo $cpu_user " "$cpu_system " " $cpu_idle " " $cpu_iowait

printf "%.1f\t\t%.1f\t\t%.1f\t\t%.1f\t\t%s\n" $cpu_user $cpu_system $cpu_idle $cpu_iowait $time

done

printf "\n"

 

#2、获取CPU上下文切换和中断次数

printf "获取cpu中断和上下文切换次数\n"

printf "cpu_interrupt\tcpu_context_switch\ttime\n"

 

record_num=`cat $2 | wc -l`

for((i=3;i<=$record_num;i++))

do

#获取时间

time=`sed -n ${i}"p" $2 | awk '{print $19}'`

#echo "当前时间"$time

 

#获取CPU中断次数

cpu_interrupt=`sed -n ${i}"p" $2 | awk '{print $11}'`

#echo "CPU中断次数:"$cpu_interrupt

 

#获取CPU上下文切换次数

cpu_context_switch=`sed -n ${i}"p" $2 | awk '{print $12}'`

#echo "CPU上下文切换次数:"$cpu_context_switch

 

printf "%d\t\t%d\t\t\t%s\n" $cpu_interrupt $cpu_context_switch $time

done

printf "\n"

 

#3、获取CPU负载信息

printf "\n获取CPU负载信息-1551分钟前到现在的负载均值\n"

printf "cpu_load_15min\tcpu_load_5min\tcpu_load_1min\ttime\n"

 

record_num=`grep "load average" $1 | wc -l`

for((i=1;i<=$record_num;i++))

do

#获取时间

time=`grep "load average" $1 | sed -n ${i}"p" | awk '{print $3}'`

#echo "当前时间"$time

 

#获取CPU15分钟前到现在的负载平均值

cpu_load_15min=`grep "load average" $1 | sed -n ${i}"p" | awk '{print $12}' | cut -f 1 -d ','`

#echo "CPU 15分钟前到现在的负载平均值:"$cpu_load_15min

 

#获取CPU5分钟前到现在的负载平均值

cpu_load_5min=`grep "load average" $1 | sed -n ${i}"p" | awk '{print $11}' | cut -f 1 -d ','`

#echo "CPU 5分钟前到现在的负载平均值:"$cpu_load_5min

 

#获取CPU1分钟前到现在的负载平均值

cpu_load_1min=`grep "load average"  $1 | sed -n ${i}"p" | awk '{print $10}' | cut -f 1 -d ','`

#echo "CPU 1分钟前到现在的负载平均值:"$cpu_load_1min

 

printf "%.2f\t\t%.2f\t\t%.2f\t\t%s\n" $cpu_load_15min $cpu_load_5min $cpu_load_1min $time

done

 

printf "获取CPU负载信息-cpu队列长度\n"

printf "cpu_task_length\ttime\n"

 

record_num=`cat $2 | wc -l`

for((i=3;i<=$record_num;i++))

do

#获取时间

time=`sed -n ${i}"p" $2 | awk '{print $19}'`

#echo "当前时间"$time

 

#获取任务队列(就绪状态等待的进程数)

cpu_task_length=`sed -n ${i}"p" $2 | awk '{print $1}'`

#echo "CPU任务队列长度:"$cpu_task_length

 

printf "%d\t\t%s\n" $cpu_task_length $time

done

printf "\n"

 

#4、获取内存信息

printf "获取内存信息\n"

printf "mem_total\tmem_sys_used\tmem_sys_free\tmem_user_used\tmem_user_free\tmem_buffers\tmem_swap_total\tmem_swap_used\tmem_swap_free\tmem_swap_cached\ttime\n"

 

record_num=`grep Mem $1 | wc -l`

for((i=1;i<=$record_num;i++))

do

#获取时间

time=`grep "load average" $1 | sed -n ${i}"p" | awk '{print $3}'`

#echo "当前时间"$time

 

#获取物理内存总量

mem_total=`grep Mem $1 | sed -n ${i}"p" | awk '{print $2}' | cut -f 1 -d 'k'`

#echo "物理内存总量:"$mem_total

 

#获取操作系统已使用内存总量

mem_sys_used=`grep Mem $1 | sed -n ${i}"p" | awk '{print $4}' | cut -f 1 -d 'k'`

#echo "已使用内存总量(操作系统)"$mem_sys_used

 

#获取操作系统未使用内存总量

mem_sys_free=`grep Mem $1 | sed -n ${i}"p" | awk '{print $6}' | cut -f 1 -d 'k'`

#echo "剩余内存总量(操作系统)"$mem_sys_free

 

#获取应用程序已使用的内存总量

mem_buffers=`grep Mem $1 | sed -n ${i}"p" | awk '{print $8}' | cut -f 1 -d 'k'`

mem_swap_cached=`grep Swap $1 | sed -n ${i}"p" | awk '{print $8}' | cut -f 1 -d 'k'`

mem_user_used=$(($mem_sys_used-$mem_buffers-$mem_swap_cached))

#echo "已使用内存总量(应用程序)"$mem_user_used

 

#获取应用程序未使用内存总量

mem_user_free=$(($mem_sys_free+$mem_buffers+$mem_swap_cached))

#echo "剩余内存总量(应用程序)"$mem_user_free

 

#获取交换分区总大小

mem_swap_total=`grep Swap $1 | sed -n ${i}"p" | awk '{print $2}' | cut -f 1 -d 'k'`

#echo "交换分区总大小:"$mem_swap_total

 

#获取已使用交换分区大小

mem_swap_used=`grep Swap $1 | sed -n ${i}"p" | awk '{print $4}' | cut -f 1 -d 'k'`

#echo "已使用交换分区大小:"$mem_swap_used

 

#获取剩余交换分区大小

mem_swap_free=`grep Swap $1 | sed -n ${i}"p" | awk '{print $6}' | cut -f 1 -d 'k'`

#echo "剩余交换分区大小:"$mem_swap_free

 

printf "%d\t\t%d\t\t%d\t\t%d\t\t%d\t\t%d\t\t%d\t\t%d\t\t%d\t\t%d\t\t%s\n" $mem_total $mem_sys_used $mem_sys_free $mem_user_used $mem_user_free $mem_buffers $mem_swap_total $mem_swap_used $mem_swap_free $mem_swap_cached $time

done

printf "\n"

 

#5、获取磁盘I/O统计信息

echo "指定设备(/dev/sda1)的统计信息"

printf "disk_sda_rs\tdisk_sda_ws\tdisk_sda_avgqu_sz\tdisk_sda_await\tdisk_sda_svctn\tdisk_sda_util\ttime\n"

 

record_num=`grep sda $3 | wc -l`

for((i=1;i<=$record_num;i++))

do

#获取时间

time=`grep "load average" $1 | sed -n ${i}"p" | awk '{print $3}'`

#echo "当前时间"$time

 

#每秒向设备发起的读请求次数

disk_sda_rs=`grep sda $3 | sed -n ${i}"p" | awk '{print $4}'`

#echo "每秒向设备发起的读请求次数:"$disk_sda_rs

 

#每秒向设备发起的写请求次数

disk_sda_ws=`grep sda $3 | sed -n ${i}"p" | awk '{print $5}'`

#echo "每秒向设备发起的写请求次数:"$disk_sda_ws

 

#向设备发起的I/O请求队列长度平均值

disk_sda_avgqu_sz=`grep sda $3 | sed -n ${i}"p" | awk '{print $9}'`

#echo "向设备发起的I/O请求队列长度平均值"$disk_sda_avgqu_sz

 

#每次向设备发起的I/O请求平均时间

disk_sda_await=`grep sda $3 | sed -n ${i}"p" | awk '{print $10}'`

#echo "每次向设备发起的I/O请求平均时间:"$disk_sda_await

 

#向设备发起的服务时间均值

disk_sda_svctm=`grep sda $3 | sed -n ${i}"p" | awk '{print $11}'`

#echo "向设备发起的服务时间均值:"$disk_sda_svctm

 

#向设备发起I/O请求的CPU时间百分占比

disk_sda_util=`grep sda $3 | sed -n ${i}"p"| awk '{print $12}'`

#echo "向设备发起I/O请求的CPU时间百分占比:"$disk_sda_util

 

printf "%.2f\t\t%.2f\t\t%.2f\t\t\t%.2f\t\t%.2f\t\t%.2f\t\t%s\n" $disk_sda_rs $disk_sda_ws $disk_sda_avgqu_sz $disk_sda_await $disk_sda_svctm $disk_sda_util $time

done

printf "\n"

 

#6、获取某个进程的CPU、内存使用信息

printf "获取某个进程的CPU、内存使用信息\n"

printf "proc_id\tproc_cpu\tproc_mem\tproc_vsz\ttime\n"

 

record_num=`grep $5 $1 | wc -l`

for((i=1;i<=$record_num;i++))

do

#获取时间

time=`grep "load average" $1 | sed -n ${i}"p" | awk '{print $3}'`

#echo "当前时间:"$time

 

#获取进程ID

proc_id=`grep $5 $1 | sed -n ${i}"p" | awk '{print $1}'`

#echo "进程ID"$proc_id

 

#获取进程CPU使用率

proc_cpu=`grep $5 $1 | sed -n ${i}"p" | awk '{print $3}'`

#echo "进程CPU使用率:"$proc_cpu

 

#获取进程内存使用率

proc_mem=`grep $5 $1 | sed -n ${i}"p" | awk '{print $4}'`

#echo "进程内存使用率:"$proc_mem

 

#获取进程虚拟内存总量

proc_vsz=`grep $5 $1 | sed -n ${i}"p" | awk '{print $5}'`

#echo "进程使用的虚拟内存总量:"$proc_vsz

 

printf "%d\t\t%.1f\t\t%.1f\t\t%d\t\t%s\n" $proc_id $proc_cpu $proc_mem $proc_vsz $time

done

 

注:获取磁盘I/O统计信息,这里收集的时间数据是大致时间-top取样时的时间,非精确时间,有可能存在较大误差

 

 

效果如下:

 




 

注:针对不同类型、版本的操作系统,以上脚本可能需要做适当修改才可适用

附脚本下载地址:Linux 性能监控之CPU&内存&I/O监控Shell脚本2.zip

 

 

目录
相关文章
|
5月前
|
缓存 人工智能 算法
不同业务怎么选服务器?CPU / 内存 / 带宽配置表
本文详解了服务器三大核心配置——CPU、内存、带宽,帮助读者快速理解服务器性能原理。结合不同业务场景,如个人博客、电商、数据库、直播等,提供配置选择建议,并强调合理搭配的重要性,避免资源浪费或瓶颈限制。内容实用,适合初学者和业务选型参考。
897 0
|
7月前
|
存储
阿里云轻量应用服务器收费标准价格表:200Mbps带宽、CPU内存及存储配置详解
阿里云香港轻量应用服务器,200Mbps带宽,免备案,支持多IP及国际线路,月租25元起,年付享8.5折优惠,适用于网站、应用等多种场景。
2342 0
|
4月前
|
弹性计算 定位技术 数据中心
阿里云服务器配置选择方法:付费类型、地域及CPU内存配置全解析
阿里云服务器怎么选?2025最新指南:就近选择地域,降低延迟;长期使用选包年包月,短期灵活选按量付费;企业选2核4G5M仅199元/年,个人选2核2G3M低至99元/年,高性价比爆款推荐,轻松上云。
354 11
|
5月前
|
缓存 监控 Linux
Linux内存问题排查命令详解
Linux服务器卡顿?可能是内存问题。掌握free、vmstat、sar三大命令,快速排查内存使用情况。free查看实时内存,vmstat诊断系统整体性能瓶颈,sar实现长期监控,三者结合,高效定位并解决内存问题。
465 0
Linux内存问题排查命令详解
|
6月前
|
弹性计算 前端开发 NoSQL
2025最新阿里云服务器配置选择攻略:CPU、内存、带宽与系统盘全解析
本文详解2025年阿里云服务器ECS配置选择策略,涵盖CPU、内存、带宽与系统盘推荐,助你根据业务需求精准选型,提升性能与性价比。
|
7月前
|
存储 弹性计算 固态存储
阿里云服务器配置费用整理,支持一万人CPU内存、公网带宽和存储IO性能全解析
要支撑1万人在线流量,需选择阿里云企业级ECS服务器,如通用型g系列、高主频型hf系列或通用算力型u1实例,配置如16核64G及以上,搭配高带宽与SSD/ESSD云盘,费用约数千元每月。
753 0
|
9月前
|
缓存 Linux 数据安全/隐私保护
Linux环境下如何通过手动调用drop_caches命令释放内存
总的来说,记录住“drop_caches” 命令并理解其含义,可以让你在日常使用Linux的过程中更加娴熟和自如。
1497 23
|
11月前
|
监控 Linux Python
Linux系统资源管理:多角度查看内存使用情况。
要知道,透过内存管理的窗口,我们可以洞察到Linux系统运行的真实身姿,如同解剖学家透过微观镜,洞察生命的奥秘。记住,不要惧怕那些高深的命令和参数,他们只是你掌握系统"魔法棒"的钥匙,熟练掌握后,你就可以骄傲地说:Linux,我来了!
378 27
|
12月前
|
缓存 NoSQL Linux
Linux系统内存使用优化技巧
交换空间(Swap)的优化 禁用 Swap sudo swapoff -a 作用:这个命令会禁用系统中所有的 Swap 空间。swapoff 命令用于关闭 Swap 空间,-a 参数表示关闭 /etc/fstab 文件中配置的所有 Swap 空间。 使用场景:在高性能应用场景下,比如数据库服务器或高性能计算服务器,禁用 Swap 可以减少磁盘 I/O,提高系统性能。
472 3