还在用命令行查问题吗?云监控提供30余种服务器监控指标,等你来用!

简介: 云监控主机监控上线啦,支持控制台一键安装和命令行手工安装,提供30余种监控指标、秒级频率、进程级粒度。

主机监控功能上线啦

排查这些问题,你还在用命令行查询服务器各项指标吗?历史快照怎么拿?想要预警怎么办?烦死宝宝啦。

云监控为阿里云用户提供主机监控功能,一键安装插件后,即可查看30余个监控项的监控图表,设置报警更是天然支持~~也可以安装在非 ECS 的服务器上,有没有很开心~

立刻使用主机监控

屏幕快照 2016-11-28 下午4.30.34.png
屏幕快照 2016-11-28 下午4.30.44.png

进程监控介绍

进程监控默认为您采集最近一段时间内活跃进程消耗的CPU使用率、内存使用率,以及进程的文件打开数。如果您添加了进程关键字,还会采集包含关键字的进程个数。

  • 如果您查询的时间范围内,Top5的进程不固定,进程列表中会展示这段时间内全部进入过Top5的进程,列表中的时间表示该进程最后一次进入Top5的时间。
  • 只有进入Top5 的进程才会采集进程的CPU使用率、内存使用率和打开文件数,所以如果该进程在查询的时间范围内未持续进入Top5,会出现监控图中数据点不连续的情况,数据点的密集程度则表明了该进程在服务器上的活跃程度。

屏幕快照 2016-11-28 下午4.57.10.png

监控项说明

CPU 相关监控项

以下为CPU使用率相关监控指标,可参考Linux的top命令来理解各项指标含义。

监控项名称 监控项含义 单位 说明
Host.cpu.idle 当前空闲CPU百分比  %
Host.cpu.system 当前内核空间占用CPU百分比 % 指系统上下文切换的消耗,该监控项数值比较高,说明服务器开了太多的进程或者线程
Host.cpu.user 当前用户空间占用CPU百分比 % 用户进程对CPU的消耗
Host.cpu.iowait 当前等待IO操作的CPU百分比 % 该项数值比较高说明有很频繁的IO操作
Host.cpu.other 其他占用CUP百分比 % 其他消耗,计算方式为(Nice + SoftIrq + Irq + Stolen)的消耗
Host.cpu.total 当前消耗的总CPU百分比 % 指以上各项CPU消耗的总和,通常用于报警

内存相关监控项

以下为内存相关监控项,可参考free命令来理解各项指标含义。

监控项名称 监控项含义 单位 说明
Host.mem.total 内存总量 bytes 服务器的内存总量
Host.mem.used 已用内存量 bytes 用户程序使用的内存 + buffers + cached,buffers为缓冲区占用的内存空间,cached为系统缓存占用的内存空间
Host.mem.actualused 用户实际使用的内存 bytes 计算方法为(used - buffers - cached)
Host.mem.free 剩余内存量 bytes 计算方法为(内存总量-已用内存量)
Host.mem.freeutilization 剩余内存百分比 % 计算方法为(剩余内存量/内存总量*100%)
Host.mem.usedutilization 内存使用率 % 计算方法为( Actual used/total*100%)

系统平均负载监控项

以下为系统平均负载相关监控项,可参考Linux top命令来理解各项指标含义。监控项数值越高代表系统越繁忙。

监控项名称 监控项含义 单位
Host.load1 过去1分钟的系统平均负载,Windows操作系统没有此指标
Host.load5 过去5分钟的系统平均负载,Windows操作系统没有此指标
Host.load15 过去15分钟的系统平均负载,Windows操作系统没有此指标

磁盘相关监控项

  • 磁盘使用率与inode使用率可参考Linux df命令。
  • 磁盘读写指标可参考Linux iostat命令。
监控项名称 监控项含义 单位
Host.diskusage.used 磁盘的已用存储空间 bytes
Host.disk.utilization 磁盘使用率 %
Host.diskusage.free 磁盘的剩余存储空间 bytes/s
Host.diskussage.total 磁盘存储总量 bytes
Host.disk.readbytes 磁盘每秒读取的字节数 bytes/s
Host.disk.writebytes 磁盘每秒写入的字节数 bytes/s
Host.disk.readiops 磁盘每秒的读请求数量 次/秒
Host.disk.writeiops 磁盘每秒的写请求数量 次/秒

文件系统监控项

监控项名称 监控项含义 单位 说明
Host.fs.inode inode使用率,UNIX/Linux系统内部使用inode号码来识别文件,磁盘还未存满,但inode已经分配完时会出现无法在磁盘新建文件的情况,Windows操作系统没有此指标 % inode数量代表文件系统文件数量,大量小文件会导致inode使用率过高

网络相关监控项

  • 以下为网络相关指标,可参考Linux iftop。TCP连接数的采集,可参考Linux ss命令。
  • TCP连接数会默认采集 TCP_TOTAL(总连接数)、ESTABLISHED(正常连接状态),NON_ESTABLISHED(非连接的状态连接数,ESTABLISHED以外的所有状态),如果您需要获取各个状态连接数的数量,请按如下说明操作:
Linux操作系统
    您可以将cloudmonitor/config/conf.properties配置文件的netstat.tcp.disable改为false来开启采集。修改配置后请重启Agent。
    
Windows操作系统
    您可以在C:\”Program Files”\Alibaba\cloudmonitor\config的配置文件中,将netstat.tcp.disable改为false来开启采集。修改配置后请重启Agent。
监控项名称 监控项含义 单位
Host.netin.rate 网卡每秒接收的比特数,即网卡的上行带宽 bits/s
Host.netout.rate 网卡每秒发送的比特数,即网卡的下行带宽 bits/s
Host.netin.packages 网卡每秒接收的数据包数 个/秒
Host.netout.packages 网卡每秒发送的数据包数 个/秒
Host.netin.errorpackage 设备驱动器检测到的接收错误包的数量 个/秒
Host.netout.errorpackages 设备驱动器检测到的发送错误包的数量 个/秒
Host.tcpconnection 各种状态下的TCP连接数包括LISTEN、SYN_SENT、ESTABLISHED、SYN_RECV、FIN_WAIT1、CLOSE_WAIT、FIN_WAIT2、LAST_ACK、TIME_WAIT、CLOSING、CLOSED

进程相关监控项

  • 进程的CPU使用率、内存使用率可参考Linux top命令,CPU使用率为多核使用情况。
  • Host.process.openfile 可参考Linux lsof命令。
  • Host.process.number 可参考Linux ps aux |grep '关键字' 命令。
监控项名称 监控项含义 单位
Host.process.cpu 某个进程消耗的CPU百分比 %
Host.process.memory 某个进程消耗的内存百分比 %
Host.process.openfile 当前进程打开文件数
Host.process.number 指定关键字的进程数

立刻使用主机监控

更多了解欢迎阅读文档:使用文档

相关实践学习
RocketMQ监控/告警一站式搭建应用
RocketMQ监控/告警一站式搭建演示
目录
相关文章
|
1月前
|
机器学习/深度学习 搜索推荐 算法
推荐系统离线评估方法和评估指标,以及在推荐服务器内部实现A/B测试和解决A/B测试资源紧张的方法。还介绍了如何在TensorFlow中进行模型离线评估实践。
推荐系统离线评估方法和评估指标,以及在推荐服务器内部实现A/B测试和解决A/B测试资源紧张的方法。还介绍了如何在TensorFlow中进行模型离线评估实践。
236 0
|
运维 监控 数据可视化
ELK日志监控分析系统的探索与实践(二):利用Metricbeat监控服务器系统指标
在ELK日志监控分析系统的探索与实践(一)中,我们介绍了如何利用ELK+Filebeat监控Springboot项目的日志,本篇则是重点介绍如何利用ELk+Metricbeat监控服务器系统CPU、内存、磁盘等系统指标。
ELK日志监控分析系统的探索与实践(二):利用Metricbeat监控服务器系统指标
|
10月前
|
存储 弹性计算 编解码
阿里云倚天云服务器全方位介绍(市场背景、产品技术、指标数据等)
倚天云服务器是阿里云目前非常热门的云服务器产品,也是阿里云在2023年主推的系列云服务器,目前倚天云服务器包括计算型c8y、通用型g8y、内存型r8y等实例规格,倚天云服务器采用阿里自研倚天710处理器,基于最新一代CIPU和Dragonfly ARM Hypervisor ,通过芯片快速路径加速手段实现计算、存储、网络性能的大幅提升。本文介绍阿里云倚天云服务器推出的市场背景、倚天云服务器的产品技术如何以及倚天云服务器的各项指标数据情况。
958 0
阿里云倚天云服务器全方位介绍(市场背景、产品技术、指标数据等)
|
12月前
|
存储 机器学习/深度学习 Dragonfly
阿里云服务器c8y、g8y、r8y实例性能、指标数据及最新价格分享
继推出轻量应用服务器与通用算力型u1、计算型c7、通用型g7和内存型r7实例云服务器优惠之后,阿里云服务器优惠上新品了,性价比最高的c8y、g8y、r8y云服务器7.2折,购买时长最高可选5年,c8y、g8y、r8y云服务器采用阿里自研倚天710处理器,基于最新一代CIPU和Dragonfly ARM Hypervisor ,通过芯片快速路径加速手段实现计算、存储、网络性能的大幅提升。下面小编来详细介绍下这几款云服务器的实例性能、指标数据及可选配置和优惠价格情况。
阿里云服务器c8y、g8y、r8y实例性能、指标数据及最新价格分享
|
存储 缓存 安全
阿里云服务器计算型c7 通用型g7 内存型r7实例性能及指标数据解析
计算型c7 通用型g7 内存型r7实例均属于阿里云最新的第七代云服务器实例规格,七代云服务器全量搭载安全芯片、构建新一代立体化可信环境,在云服务器安全、存储、网络和端到端性能方面均有所提升。下面是小编整理的阿里云服务器计算型c7 通用型g7 内存型r7实例性能及指标数据解析。
765 0
阿里云服务器计算型c7 通用型g7 内存型r7实例性能及指标数据解析
|
监控 机器人
让你的服务器和应用不再担惊受怕-阿里云监控配置实战
让你的服务器和应用不再担惊受怕-阿里云监控配置实战
232 0
让你的服务器和应用不再担惊受怕-阿里云监控配置实战
|
消息中间件 监控 NoSQL
ELK搭建(三):监控服务器CPU、网络、磁盘、内存指标
本期我们来讲解如何通过ELK+metricbeat来监控服务器/主机中的CPU、网络、磁盘、内存等指标变化。并绘制会数据看板来方便我们实时监控
456 0
ELK搭建(三):监控服务器CPU、网络、磁盘、内存指标
|
测试技术
软件测试面试题:Web服务器指标指标?
软件测试面试题:Web服务器指标指标?
75 0
|
存储 SQL 机器学习/深度学习
智能巡检云监控指标的最佳实践
在真实的企业生产中,对研发和运维的同学都会面临一个十分繁复且艰难的问题,就是对指标的监控和告警。具体我枚举一些特定的问题请对号入座,看看在算力爆炸的时代能否通过算力和算法一起解决!
919 0
|
机器学习/深度学习 存储 弹性计算
SLS机器学习服务最佳实践:ECS时序指标监控巡检
云服务器ECS是阿里云所提供的性能卓越、稳定可靠、可弹性扩展的IaaS级别云计算服务。使用云服务器ECS可以不用采购IT硬件设备,直接像使用水、电、天然气等公共资源一样便捷、高效地使用服务器,实现计算资源的即开即用和弹性伸缩。众多业务或服务在ECS上面运行,机器的稳定性对维持服务的稳定性来说尤为关键。本期将为大家介绍利用阿里云SLS(原日志服务),采集ECS的CPU、内存、负载、磁盘、网络等监控数据,并进行智能巡检与异常检测,形成对ECS主机的健康监控大盘,帮助你更好的管理并维护自己的云服务器。
5271 0