还在用命令行查问题吗?云监控提供30余种服务器监控指标,等你来用!

本文涉及的产品
云监控,每月短信1000条
简介: 云监控主机监控上线啦,支持控制台一键安装和命令行手工安装,提供30余种监控指标、秒级频率、进程级粒度。

主机监控功能上线啦

排查这些问题,你还在用命令行查询服务器各项指标吗?历史快照怎么拿?想要预警怎么办?烦死宝宝啦。

云监控为阿里云用户提供主机监控功能,一键安装插件后,即可查看30余个监控项的监控图表,设置报警更是天然支持~~也可以安装在非 ECS 的服务器上,有没有很开心~

立刻使用主机监控

屏幕快照 2016-11-28 下午4.30.34.png
屏幕快照 2016-11-28 下午4.30.44.png

进程监控介绍

进程监控默认为您采集最近一段时间内活跃进程消耗的CPU使用率、内存使用率,以及进程的文件打开数。如果您添加了进程关键字,还会采集包含关键字的进程个数。

  • 如果您查询的时间范围内,Top5的进程不固定,进程列表中会展示这段时间内全部进入过Top5的进程,列表中的时间表示该进程最后一次进入Top5的时间。
  • 只有进入Top5 的进程才会采集进程的CPU使用率、内存使用率和打开文件数,所以如果该进程在查询的时间范围内未持续进入Top5,会出现监控图中数据点不连续的情况,数据点的密集程度则表明了该进程在服务器上的活跃程度。

屏幕快照 2016-11-28 下午4.57.10.png

监控项说明

CPU 相关监控项

以下为CPU使用率相关监控指标,可参考Linux的top命令来理解各项指标含义。

监控项名称 监控项含义 单位 说明
Host.cpu.idle 当前空闲CPU百分比  %
Host.cpu.system 当前内核空间占用CPU百分比 % 指系统上下文切换的消耗,该监控项数值比较高,说明服务器开了太多的进程或者线程
Host.cpu.user 当前用户空间占用CPU百分比 % 用户进程对CPU的消耗
Host.cpu.iowait 当前等待IO操作的CPU百分比 % 该项数值比较高说明有很频繁的IO操作
Host.cpu.other 其他占用CUP百分比 % 其他消耗,计算方式为(Nice + SoftIrq + Irq + Stolen)的消耗
Host.cpu.total 当前消耗的总CPU百分比 % 指以上各项CPU消耗的总和,通常用于报警

内存相关监控项

以下为内存相关监控项,可参考free命令来理解各项指标含义。

监控项名称 监控项含义 单位 说明
Host.mem.total 内存总量 bytes 服务器的内存总量
Host.mem.used 已用内存量 bytes 用户程序使用的内存 + buffers + cached,buffers为缓冲区占用的内存空间,cached为系统缓存占用的内存空间
Host.mem.actualused 用户实际使用的内存 bytes 计算方法为(used - buffers - cached)
Host.mem.free 剩余内存量 bytes 计算方法为(内存总量-已用内存量)
Host.mem.freeutilization 剩余内存百分比 % 计算方法为(剩余内存量/内存总量*100%)
Host.mem.usedutilization 内存使用率 % 计算方法为( Actual used/total*100%)

系统平均负载监控项

以下为系统平均负载相关监控项,可参考Linux top命令来理解各项指标含义。监控项数值越高代表系统越繁忙。

监控项名称 监控项含义 单位
Host.load1 过去1分钟的系统平均负载,Windows操作系统没有此指标
Host.load5 过去5分钟的系统平均负载,Windows操作系统没有此指标
Host.load15 过去15分钟的系统平均负载,Windows操作系统没有此指标

磁盘相关监控项

  • 磁盘使用率与inode使用率可参考Linux df命令。
  • 磁盘读写指标可参考Linux iostat命令。
监控项名称 监控项含义 单位
Host.diskusage.used 磁盘的已用存储空间 bytes
Host.disk.utilization 磁盘使用率 %
Host.diskusage.free 磁盘的剩余存储空间 bytes/s
Host.diskussage.total 磁盘存储总量 bytes
Host.disk.readbytes 磁盘每秒读取的字节数 bytes/s
Host.disk.writebytes 磁盘每秒写入的字节数 bytes/s
Host.disk.readiops 磁盘每秒的读请求数量 次/秒
Host.disk.writeiops 磁盘每秒的写请求数量 次/秒

文件系统监控项

监控项名称 监控项含义 单位 说明
Host.fs.inode inode使用率,UNIX/Linux系统内部使用inode号码来识别文件,磁盘还未存满,但inode已经分配完时会出现无法在磁盘新建文件的情况,Windows操作系统没有此指标 % inode数量代表文件系统文件数量,大量小文件会导致inode使用率过高

网络相关监控项

  • 以下为网络相关指标,可参考Linux iftop。TCP连接数的采集,可参考Linux ss命令。
  • TCP连接数会默认采集 TCP_TOTAL(总连接数)、ESTABLISHED(正常连接状态),NON_ESTABLISHED(非连接的状态连接数,ESTABLISHED以外的所有状态),如果您需要获取各个状态连接数的数量,请按如下说明操作:
Linux操作系统
    您可以将cloudmonitor/config/conf.properties配置文件的netstat.tcp.disable改为false来开启采集。修改配置后请重启Agent。
    
Windows操作系统
    您可以在C:\”Program Files”\Alibaba\cloudmonitor\config的配置文件中,将netstat.tcp.disable改为false来开启采集。修改配置后请重启Agent。
监控项名称 监控项含义 单位
Host.netin.rate 网卡每秒接收的比特数,即网卡的上行带宽 bits/s
Host.netout.rate 网卡每秒发送的比特数,即网卡的下行带宽 bits/s
Host.netin.packages 网卡每秒接收的数据包数 个/秒
Host.netout.packages 网卡每秒发送的数据包数 个/秒
Host.netin.errorpackage 设备驱动器检测到的接收错误包的数量 个/秒
Host.netout.errorpackages 设备驱动器检测到的发送错误包的数量 个/秒
Host.tcpconnection 各种状态下的TCP连接数包括LISTEN、SYN_SENT、ESTABLISHED、SYN_RECV、FIN_WAIT1、CLOSE_WAIT、FIN_WAIT2、LAST_ACK、TIME_WAIT、CLOSING、CLOSED

进程相关监控项

  • 进程的CPU使用率、内存使用率可参考Linux top命令,CPU使用率为多核使用情况。
  • Host.process.openfile 可参考Linux lsof命令。
  • Host.process.number 可参考Linux ps aux |grep '关键字' 命令。
监控项名称 监控项含义 单位
Host.process.cpu 某个进程消耗的CPU百分比 %
Host.process.memory 某个进程消耗的内存百分比 %
Host.process.openfile 当前进程打开文件数
Host.process.number 指定关键字的进程数

立刻使用主机监控

更多了解欢迎阅读文档:使用文档

相关实践学习
基于云监控实现的监控系统
通过阿里云云监控功能给非阿里云主机安装监控插件,从而实现对非阿里云主机的各项指标进行监控和管理,在配置报警规则和报警人的情况下,能对特定的场景做出报警反应通知到报警人的手机上。
目录
相关文章
|
Linux Python
bypy:使用Linux命令行上传及下载百度云盘文件(远程服务器大文件传输必备)
bypy:使用Linux命令行上传及下载百度云盘文件(远程服务器大文件传输必备)
bypy:使用Linux命令行上传及下载百度云盘文件(远程服务器大文件传输必备)
|
7月前
|
机器学习/深度学习 搜索推荐 算法
推荐系统离线评估方法和评估指标,以及在推荐服务器内部实现A/B测试和解决A/B测试资源紧张的方法。还介绍了如何在TensorFlow中进行模型离线评估实践。
推荐系统离线评估方法和评估指标,以及在推荐服务器内部实现A/B测试和解决A/B测试资源紧张的方法。还介绍了如何在TensorFlow中进行模型离线评估实践。
448 0
|
运维 监控 数据可视化
ELK日志监控分析系统的探索与实践(二):利用Metricbeat监控服务器系统指标
在ELK日志监控分析系统的探索与实践(一)中,我们介绍了如何利用ELK+Filebeat监控Springboot项目的日志,本篇则是重点介绍如何利用ELk+Metricbeat监控服务器系统CPU、内存、磁盘等系统指标。
ELK日志监控分析系统的探索与实践(二):利用Metricbeat监控服务器系统指标
|
3月前
|
存储 弹性计算 缓存
阿里云服务器ECS通用型实例规格族特点、适用场景、指标数据解析
阿里云服务器ECS提供了多种通用型实例规格族,每种规格族都针对不同的计算需求、存储性能、网络吞吐量和安全特性进行了优化。以下是对存储增强通用型实例规格族g8ise、通用型实例规格族g8a、通用型实例规格族g8y、存储增强通用型实例规格族g7se、通用型实例规格族g7等所有通用型实例规格族的详细解析,包括它们的核心特点、适用场景、实例规格及具体指标数据,以供参考。
阿里云服务器ECS通用型实例规格族特点、适用场景、指标数据解析
|
3月前
|
存储 弹性计算 安全
阿里云服务器ECS计算型实例规格族特点、适用场景、指标数据参考
阿里云服务器ECS提供了丰富的计算型实例规格族,专为满足不同场景下的高性能计算需求而设计。包括计算型实例规格族c8y、计算型实例规格族c7、计算型实例规格族c8i等热门计算型实例规格,以及网络增强型的c7nex、密集计算型的ic5等其他计算型实例规格,每一种规格族都经过精心优化,确保在计算性能、存储效率、网络吞吐和安全特性等方面达到最佳平衡。本文将详细解析阿里云服务器ECS中的多个计算型实例规格族,包括它们的核心特点、适用场景、实例规格及具体指标数据,为用户在云计算资源选型时提供全面参考。
阿里云服务器ECS计算型实例规格族特点、适用场景、指标数据参考
|
2月前
SecureCRT 通过xftp命令行上传文件到服务器上
SecureCRT 通过xftp命令行上传文件到服务器上
149 1
|
2月前
|
Java Linux Maven
服务器部署之项目打包及命令行输出
服务器部署之项目打包及命令行输出
54 0
|
3月前
|
存储 弹性计算 网络协议
阿里云ECS内存型实例规格族特点、适用场景、指标数据参考
阿里云ECS提供了多样化的内存型实例规格族,专为需要高性能内存资源的应用场景设计。从最新的r8a系列到经过优化的re6p系列,旨在提供稳定、高效且安全的计算环境。这些实例不仅具备强大的计算性能与内存配比,还通过支持ESSD云盘和高效网络协议,显著提升了存储I/O能力和网络带宽,适用于大数据分析、高性能数据库、内存密集型应用等多种场景,为用户带来卓越的计算体验。本文将详细解析阿里云ECS中的多个内存型实例规格族,包括它们的核心特点、适用场景、实例规格及具体指标数据,为用户在云计算资源选型时提供参考。
|
5月前
|
弹性计算 Prometheus Cloud Native
可观测性体系问题之ECS管控中重点指标的定义如何解决
可观测性体系问题之ECS管控中重点指标的定义如何解决
33 4
|
4月前
|
监控 Linux 测试技术