Linux下的监控器之一Ganglia详解与部署-阿里云开发者社区

开发者社区> 开发与运维> 正文

Linux下的监控器之一Ganglia详解与部署

简介:

Ganglia基础详解

Ganglia介绍 
Ganglia是一个跨平台可扩展的,高性能计算系统下的分布式监控系统,如集群和网格。它是基于分层设计,它使用广泛的技术,如XML数据代表,便携数据传输,RRDtool用于数据存储和可视化。它利用精心设计的数据结构和算法实现每节点间并发非常低的。它已移植到广泛的操作系统和处理器架构上,目前在世界各地成千上万的集群正在使用。


Ganglia特点

  1. 具有良好的扩展性,分层架构使用与大规模服务器集群的架构

  2. 负载开销低,支持高并发

  3. 广泛支持各种操作系统


Ganglia组成 
这里写图片描述

Ganglia框架有gmond,gmated和webfronted进程组成: 
gmond:是运行在被监控节点的守护进程,负责采集本节点的上数据,同时也接受替他节点上发送过来的数据,默认监听在8649。 
gmated:运行在监控节点上的守护进程,负责定期检查每个gmond进程并从哪里获取数据,然后将数据存储在本地的RRD存储引擎中。 
webfronted:使用PHP写成的web图形化界面,功能从gmetad获取数据并且读出数据库,通过rrdtool工具生成图表,通过http协议显示在终端上。


Ganglia的工作模型

node:监控单个服务器 
这里写图片描述

一台主机运行gmond进程,另一台主机运行gmetad进程进行数据采集。


cluster:监控一个集群

主机A,B,C,D,E模型一:     主机A,B,C,D作为被监控端,运行gmont进程。     主机E作为监控端运行gmetad进程。 模型二:     主机A,B,C:被监控端     主机D:运行gmont进程,负责采集A,B,C传送的数据,最终将数据传送给监控节点。     主机E:监控节点 模型三:     如见下图:

模式一 
模式二 
模式三

grid:监控一个网格,由多个集群服务组成


Ganglia之间的通信

gmond<–>gmond:采用UDP通信协议,并以文件格式为XDL的格式进行发送。 
gmond<–>gmetad:采用TCP通信协议,并以文件格式为XML的形式进行传送。 
gmetad<–>gmetad:采用TCP通信协议,并以文件格式为XML的形式进行传送。

  1. 通常采用单播和多播进行通信

  2. gmond与gmond之间以多播的方式行通信(默认)。gmond向外发送数据,相邻的gmond主机也会收到数据。

    Ganglia的部署

    部署结构


  主机                  IP                   作用
  Clone1           192.168.80.129             监控
  Clone2           192.168.80.130             被监控


监控端部署

gmetad安装:

提前安装confuse,rrdtool yum源安装:     [root@Clone1 ~]# yum install ganglia-gmetad ganglia-web 编译安装gmetad:     [root@Clone1 ~]#  wget https://jaist.dl.sourceforge.net/project/ganglia/ganglia%20monitoring%20core/3.7.2/ganglia-3.7.2.tar.gz     [root@Clone1 ~]# tar -xzf ganglia-3.7.2.tar.gz      [root@Clone1 ~]# cd ganglia-3.7.2     [root@Clone1 ganglia-3.7.2]# ./configure --prefix=/usr/local/ganglia --with-static-modules --enable-gexec --enable-status --with-gmetad   --with-libexpat --with-libconfuse=/usr/local/confuse --with-libpcre --with-librrd=/usr/local/rrtdool --htmldir=/var/www/html/gangia     [root@Clone1 ganglia-3.7.2]# make && make install

gmetad配置:

 1. 在安装包文件中找到gmetad.init文件   2. 将此文件复制到/etc/rc.d/init.d/gmetad     [root@Clone1 gmetad]# cp gmetad.init /etc/rc.d/init.d/gmetad  3. 编辑/etc/rc.d/init.d/gmetad,设置GMSTA=/usr/local/ganglia/sbin/gmetad   4. 添加多播地址     [root@Clone1 sbin]# ip route add 239.2.11.71 dev eth0  5. 编辑配置文件     data_source "Ganglia" 192.168.80.130    //定义集群的名称,以及集群的节点     gridname "MyGrid"      //定义一个网格名称,网格中的服务器集群由data_source定义     xml_port 8651       //定义一个接受数据的端口,默认伪8651     interactive_port 8652    //此参数定义web端获取数据的端口,     rrd_rootdir "/var/lib/ganglia/rrds"     //rrd数据库的存放路径,默认伪/var/lib/ganglia/rrds

ganglia-web配置:

 1. yum源安装:     [root@Clone1 ~]# yum install  ganglia-web     [root@Clone1 ~]# cp /usr/share/ganglia/* /var/www/html/  2. 编译安装:     [root@Clone1 ~]# git clone https://github.com/ganglia/ganglia-web.git     [root@Clone1 ~]# cd ganglia-web/     [root@Clone1 ganglia-web]# cp -rv  * /var/www/html/ganglia/     [root@Clone1 ganglia]# mv conf_default.php.in conf_default.php  3. 编辑conf_default.php          $conf['gmetad_root'] = "/var/lib/ganglia";  //ganglia-gmetad安装目录          $conf['gweb_root'] . "/version.php";           //genglia的web根目录       $conf['rrds'] = "${conf['gmetad_root']}/rrds";   //web读物rrd数据库的路径          $conf['dwoo_compiled_dir'] = "${conf['gweb_confdir']}/dwoo/compiled"; //需要777权限          $conf['dwoo_cache_dir'] = "${conf['gweb_confdir']}/dwoo/cache";            //需要777权限          $conf['rrdtool'] = "/usr/local/rrtdool/bin/rrdtool";      //指定rrdtool的路径          $conf['graphdir']= $conf['gweb_root'] . '/graph.d';      //生成图成模板目录          $conf['ganglia_ip'] = "127.0.0.1"; //gmetad服务器的地址          $conf['ganglia_port'] = 8652;      //提供监控数据端口       4. 改变rrd库的权限为777  5. 创建/var/www/html/ganglia/dwoo/下comiled目录和cache目录,并赋予可写权限

被监控端部署

gmond安装:

前提安装confuse       1. yum安装:     [root@Clone2 ~]#  yum install ganglia-gmond  2. 编译安装:     [root@Clone1 ~]#  wget https://jaist.dl.sourceforge.net/project/ganglia/ganglia%20monitoring%20core/3.7.2/ganglia-3.7.2.tar.gz     [root@Clone1 ~]# tar -xzf ganglia-3.7.2.tar.gz      [root@Clone1 ~]# cd ganglia-3.7.2     [root@Clone2 confuse-2.5]# ./configure --prefix=/usr/local/ganglia --enable-gexec --enable-status  --with-libconfuse=/usr/local/confuse --with-expat=/usr --with-libpcre=/usr     [root@Clone2 confuse-2.5]# make && make install

gmond配置:

 1. cp启动文件     [root@Clone2 gmond]# cp gmond.init /etc/rc.d/init.d/gmond  2. 编译启动文件/etc/rc.d/init.d/gmond:     GMSTA=/usr/local/ganglia/sbin/gmond   3. 配置多播地址:     [root@Clone2 ganglia-3.7.2]# ip route add 239.2.11.71 dev eth0  4. 生成配置文件:     [root@Clone3 gmond]# ./gmond -t > /etc/ganglia/gmond.conf     [root@Clone3 gmond]# ./gmond -t > /usr/local/ganglia/etc/gmond.conf

gmond配置文件:

gmond的配置文件分为Gloabl,cluster,host,协议配置四部分组成 第一部分: globals {   daemonize = yes      //是否后台运行   setuid = yes         //是否设置用户运行   user = nobody        //运行程序的用户   debug_level = 0      //调试级别   max_udp_msg_len = 1472        //最大UDP队列长度   mute = no             //是否将采集到的数据广播到其他节点   deaf = no             //是否接受其他节点发送过来的数据   allow_extra_data = yes      //允许额外数据   host_dmax = 86400          //是否删除一个节点,0表示永不删除,非0表示不响应时间,超过这个时间系统会刷新集群节点,从而删除此节点   host_tmax = 20            //   cleanup_threshold = 300    //清理过期数据的时间   gexec = no          //是否使用gexec来告知主机是否可用   send_metadata_interval = 0       //在单播通信中,新添加的节点多长时间表示一下自己的存在,0表示启动时通知。} 第二部分:定义主机在集群中的信息cluster {   name = "my cluster"        //集群名称,要与监控端data_source其中一项匹配   owner = "unspecified"       //节点拥有者   latlong = "unspecified"     //节点的坐标,一般不用指定   url = "unspecified"         //节点的URL,一般不用指定}  第三部分:定义主机 host {   location = "unspecified"      //节点的物理位置,一般不用指定} 第四部分:协议配置 udp_send_channel {      //udp发送通道     mcast_join = 239.2.11.71        //指定发送的多播地址,单播模式下,为host_ip,可以定义多个udp_send_channel     port = 8649                     //监听的端口     ttl = 1} udp_recv_channel {      //udp接受通道     mcast_join = 239.2.11.71        //指定接受的多播地址     port = 8649                     //监听的端口     bind = 239.2.11.71              //绑定地址     retry_bind = true } tcp_accept_channel {     port = 8649                          gzip_output = no }


结果 
这里写图片描述

本文转自lnsaneLlinux博客51CTO博客,原文链接http://blog.51cto.com/lnsane784/1955141如需转载请自行联系原作者

Insane_linux

版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。

分享:
开发与运维
使用钉钉扫一扫加入圈子
+ 订阅

集结各类场景实战经验,助你开发运维畅行无忧

其他文章