Ganglia监控

简介:

一、Ganglia是什么?


     Ganglia是由UC Berkeley发起的一个开源项目,主要通过收集各节点上的度量数据(如处理器速度、内存使用量等)实现系统性能的监控。Ganglia的核心包含gmetad、gmond以及Web前端三部分,这三部分之间通过XDL(xml的压缩格式)或者XML格式传递监控数据,达到监控效果。


二、Ganglia工作原理图

    Ganglia监控的大致过程为:集群内的节点通过运行gmond收集并相互发布节点状态信息,然后gmetad利用RRDTool工具周期性的轮询gmond收集到的信息,然后存入rrd数据库,最后再利用RRDTool工具将收集到的数据创建成图表,并通过web前端将其显示出来。



c41f4296aedfe348bc4718f604aa5ef9.png-wh_


二、Ganglia的组件


(1)Gmetad程序

         Gmetad用于轮询gmond节点存储的信息,并更新到rrd数据库中

          一个数据源节点就是是一个gmond节点。一个gmetad节点可以设置多个数据源节点,每个数据源节点可以有多个备份,一个数据源节点失败了还可以从其他节点取数据。可以把Gmetad理解为服务器。

          Gmetad只有TCP通道,一方面它向datasource发送请求,获取数据源节点的XML文件,另一方面会使用一个8651的默认TCP端口发布自身收集的XML文件,因此,Gmetad即可以从Gmond也可以从其他Gmetad节点获取XML数据。


(2)Gmond程序

         Gmond收集:一般用于收集本机的监控数据,用gmond.conf的udp_rev_channel来配置

         Gmond存储:并不是所有的gmond的都用来存储,可以找出其中的一台或者几台来存储即可,用gmond.conf的udp_send_channel来配置

         Gmond节点之间的信息发送接收主要用udp协议,传递文件格式为XDL。


        每个Gmond收集到的数据供Gmetad读取,Gmond通过默认端口8649监听到Gmetad请求后将XML格式数据发送给Gmetad。可以将Gmond理解为客户端。

         Gmond收集数据有muticast和unicast两种。Gmond本身具有UDP的发送(send)和接受(recv)通道以及TCP的接收(recv)通道。其中UDP通道用于向其他Gmond节点发送或接收数据,TCP通道主要接受来自Gmetad的请求,向Gmetad发送XML文件。在muticast模式下,Gmond节点之间通过UDP向多播目标相互传递数据。

d13530e2607f12118bf707a4ddd9c6b8.jpg-wh_


Gmond节点模块结构主要有三个模块组成:

1)collect and publish模块,该模块周期性的调用一些内部命令获得metric data,然后将这些数据通过UDP通道发布给其他Gmond节点。

2)Listen Threads监听其他Gmond节点发送的UDP数据,并将这些数据存放在内存中

3)XML Export Threads负责将数据以XML格式发布出去,比如交给Gmetad。

f1bca9296559606b7e1fa657cca0811c.png-wh_

在unicast模式下,多个Gmond节点通过UDP向单播的目标主机host的Gmond发送数据,Gmetad然后向目标主机的Gmond请求XML文件

在Unicast模式下,Gmond、Gmetad、rrd数据库以及web前端通常位于集群内的同一个节点上,该节点负责收集、存储、显示被监控的各节点的状态信息。


(3)Web前端

          Web前端通常和Gmetad安装在同一个节点上,它从Gmetad中取数据,并且读取rrd数据库,生成图片显示出来。



     本文转自西鼠 51CTO博客,原文链接:http://blog.51cto.com/10630401/1976444,如需转载请自行联系原作者





相关文章
|
3月前
|
人工智能 Ubuntu 安全
零基础教程:OpenClaw阿里云上+VMware虚拟机+Windows本地部署,安全高效打造AI Agent 助理
OpenClaw作为2026年主流开源AI智能体框架,凭借“跨端指令执行+自动化任务处理”的核心能力,实现了手机端下达指令、设备端自动完成任务的高效体验。但作为具备文件读写、命令执行、网络访问权限的智能工具,直接部署在主力设备存在数据安全风险——误删文件、访问敏感数据等问题可能造成不可逆损失。
6258 1
|
8月前
|
机器学习/深度学习 人工智能 自然语言处理
Step-Audio2 声音克隆 详细介绍
Step-Audio2是StepFun于2024年推出的中文语音克隆大模型,支持“一句话克隆+情感可控+实时流式”一体化生成,参数总量300M,首包延迟低至120ms,MOS达4.4+,采用Apache-2.0协议开源,适配商业应用,是当前中文TTS领域开源落地门槛最低的方案之一。
|
JSON Unix 数据格式
docker权限不足Got permission denied while trying to connect to the Docker daemon socket at unix:///var/r
docker权限不足Got permission denied while trying to connect to the Docker daemon socket at unix:///var/r
3374 0
|
Unix Docker 容器
Got permission denied while trying to connect to the Docker daemon socket at unix:///var/run/docker
Got permission denied while trying to connect to the Docker daemon socket at unix:///var/run/docker
2311 0
|
Linux Windows
Installing, this may take a few minutes...WslRegisterDistribution failed with error: 0x80370114Err
Installing, this may take a few minutes...WslRegisterDistribution failed with error: 0x80370114Err
7556 3
|
Web App开发 Java 应用服务中间件
|
Android开发
Android 11 SystemUI(状态/导航栏)-状态栏下拉时图标的隐藏与通知面板的半透黑色背景
Android 11 SystemUI(状态/导航栏)-状态栏下拉时图标的隐藏与通知面板的半透黑色背景
1681 0
Android 11 SystemUI(状态/导航栏)-状态栏下拉时图标的隐藏与通知面板的半透黑色背景
|
人工智能 运维 监控
货拉拉技术副总监陈永庭:基于公共云的技术稳定性保障实践
2021年10月22日,在云栖大会的《云上运维最佳实践》分论坛,货拉拉技术副总监陈永庭发表了主题为“基于云的货拉拉技术稳定性保障实践”的演讲,为大家分享了货拉拉在过去一段时间是如何做到技术稳定性保障的
货拉拉技术副总监陈永庭:基于公共云的技术稳定性保障实践
|
XML SpringCloudAlibaba Dubbo
基于dubbo rpc框架集成nacos注册中心(极简案例)
基于dubbo rpc框架集成nacos注册中心(极简案例)
607 0
基于dubbo rpc框架集成nacos注册中心(极简案例)