Ganglia监控Hadoop与HBase集群-阿里云开发者社区

Ganglia监控Hadoop与HBase集群

2017-11-21 1654

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介：

Hadoop集群基本部署完成，接下来就需要有一个监控系统，能及时发现性能瓶颈，给故障排除提供有力依据。监控hadoop集群系统好用的比较少，自身感觉ambari比较好用，但不能监控已有的集群环境，挺悲催的。ganglia在网上看到原生支持Hadoop、Hbase性能监控，试用一段时间感觉还不错，监控项比较全面，配置简单，软件包在epel网络源中，使用yum安装方便快捷。

Ganglia是一个开源集群监控系统，主要用来监控系统性能，如：cpu、mem、硬盘利用率、I/O负载、网络流量等。

Ganglia涉及到三个组件：

gmetad：定期从gmond获取数据，并将数据存储到RRD存储引擎中。

gmond：被监控端代理程序，用于收集监控信息，并发送给gmetad。

ganglia-web：WEB前端，RRD绘图后通过PHP展示。

四、Ganglia集群监控系统部署

1. CentOS7 YUM源自带epel网络源，直接安装（部署到HMaster0上，尽量单独放一台机器上）

 
        # yum install epel-release    
       
        # yum install ganglia-web ganglia-gmetad ganglia-gmond

此时会安装出来我们要安装的ganglia之外，还要安装httpd、php、rrdtool、gd、png、jpeg等相关软件包

2. 配置监控端（在HMaster0上配置）

2.1 配置监控程序

 
        # vi /etc/ganglia/gmetad.conf   #修改以下两项 
       
        data_source 
        "Hadoop" 
        192.168.18.215 192.168.18.216 192.168.18.217 192.168.18.218192.168.18.219 
       
        case_sensitive_hostnames 1

参数说明：

第一个是数据源，Hadoop是集群名字，后跟IP是集群中被监控节点地址。

第二个意思是是否区分主机名大小写，默认是0，修改为1，否则节点中主机名有大写的将保存为小写，写到/var/lib/ganglia/rrds/Hadoop中，导致图形无数据。

2.2 关联Apache，因为Ganglia自创建的配置ganglia.conf有问题，所以先删除，再创建个软连接到Apache根目录下。

 
        # rm /etc/httpd/conf.d/ganglia.conf   
       
        # ln -s /usr/share/ganglia /var/www/html/ganglia

2.3启动Apache和Ganglia，并设置开机启动

 
        # systemctl start httpd 
       
        # systemctl start gmetad 
       
        # systemctl enable httpd 
       
        # systemctl enable gmetad

3. 安装与配置被监控端（每台同样配置）

3.1 安装与配置代理程序

 
        # yum install ganglia-gmond 
       
        # vi /etc/ganglia/gmond.conf 
       
        …… 
       
        cluster{ 
       
        name = 
        "Hadoop"              
        #集群名，和上面那个一样 
       
        owner = 
        "unspecified" 
       
        latlong = 
        "unspecified" 
       
        url = 
        "unspecified" 
       
        } 
       
        /* Thehost section describes attributes of the host, like the location */ 
       
        host { 
       
        location = 
        "unspecified" 
       
        } 
       
        /*Feel 
        free 
        to specify as many udp_send_channels as you like.  Gmond 
       
        used to only support having a single channel*/ 
       
        udp_send_channel{ 
       
        #bind_hostname = yes # Highly recommended,soon to be default. 
       
        # This option tells gmond to use asource  address 
       
        # that resolves to themachine's hostname.  Without 
       
        # this, the metrics mayappear to come from any 
       
        # interface and the DNSnames associated with 
       
        # those IPs will be usedto create the RRDs. 
       
        #mcast_join = 239.2.11.71   #关闭多播 
       
        host = 192.168.18.215     
        #添加发送IP/主机名 
       
        port = 8649          
        #默认端口 
       
        ttl = 1 
       
        } 
       
        /* Youcan specify as many udp_recv_channels as you like as well. */ 
       
        udp_recv_channel{ 
       
        #mcast_join = 239.2.11.71   
       
        port = 8649 
       
        bind = 192.168.18.215      
        #接收地址 
       
        retry_bind = 
        true 
       
        # Size of the UDP buffer. If you are handlinglots of metrics you really 
       
        # should bump it up to e.g. 10MB or evenhigher. 
       
        # buffer = 10485760 
       
        } 
       
        ……

3.2 将修改好的gmond.conf配置scp到其他节点

 
        # scp /etc/ganglia/gmond.conf root@HMaster1:/etc/ganglia/gmond.conf   #分别拷贝HSlave0、1、2

3.3 启动代理程序，并设置开机启动

 
        # systemctl start gmond 
       
        # systemctl enable gmond

4. 添加Hadoop被Ganglia监控，去掉文件中以***释并修改（每台同样配置）

 
        # vi /opt/hadoop-2.6.0/etc/hadoop/hadoop-metrics2.properties 
       
        *.sink.ganglia.class=org.apache.hadoop.metrics2.sink.ganglia.GangliaSink31 
       
        *.sink.ganglia.period=10 
       
        *.sink.ganglia.supportsparse=
        true 
       
        *.sink.ganglia.slope=jvm.metrics.gcCount=zero,jvm.metrics.memHeapUsedM=both 
       
        *.sink.ganglia.dmax=jvm.metrics.threadsBlocked=70,jvm.metrics.memHeapUsedM=40 
       
        namenode.sink.ganglia.servers=192.168.18.215:8649    
        #当有多个ganglia监控系统时，以逗号分隔 
       
        datanode.sink.ganglia.servers=192.168.18.215:8649     
        #都指定ganglia服务器 
       
        resourcemanager.sink.ganglia.servers=192.168.18.215:8649 
       
        nodemanager.sink.ganglia.servers=192.168.18.215:8649

5. 添加HBase被Ganglia监控，添加如下（每台同样配置）

 
        # vi /opt/hbase-1.0.1.1/conf/hadoop-metrics2-hbase.properties 
       
        *.sink.ganglia.class=org.apache.hadoop.metrics2.sink.ganglia.GangliaSink31   
       
        *.sink.ganglia.period=10   
       
        hbase.sink.ganglia.period=10   
       
        hbase.sink.ganglia.servers=192.168.18.215:8649

6. 重启Hadoop和HBase

 
        # stop-dfs.sh 
       
        # stop-yarn.sh 
       
        # stop-hbase.sh 
       
        # start-dfs.sh 
       
        # start-yarn.sh 
       
        # start-hbase.sh   #HRegionServer节点需要手动启动（hbase-daemon.sh start regionserver）

7. 通过WEB查看性能监控数据

访问地址：http://192.168.18.215/ganglia

本文转自李振良OK 51CTO博客，原文链接：http://blog.51cto.com/lizhenliang/1669312，如需转载请自行联系原作者

Ganglia监控Hadoop与HBase集群

热门文章

最新文章

相关课程

相关电子书

相关实验场景

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

Ganglia监控Hadoop与HBase集群

热门文章

最新文章

相关课程

相关电子书

相关实验场景