监控服务器ganglia的搭建

本文涉及的产品
云数据库 RDS MySQL,集群系列 2核4GB
推荐场景:
搭建个人博客
RDS MySQL Serverless 基础系列,0.5-2RCU 50GB
云数据库 RDS MySQL,高可用系列 2核4GB
简介:

Ganglia是一款非常不错的监控软件,它可以对当前的系统软硬件进行全面的监控,特别适合集群的监控,可以对各个节点以及整个集群进行全面的监控。下面来说一下环境的搭建。

说明:操作系统rhel5.4

注意:安装系统,选择安装的软件包时不要默认安装,选择“自定义”。然后在development里面全部都勾选上,否则在安装源码包的时候会有很多报错。

clip_image002

环境搭建:LAMP的搭建用rpm包就可以了,不需要源码包。

1. 搭建一个本地yum库

编辑yum配置文件: vi /etc/yum.repos.d/rhel-debuginfo.repo内容如下:

[rhel-debuginfo]

name=Red Hat Enterprise Linux $releasever - $basearch - Debugbaseurl=file:///mnt/Server

enabled=1

gpgcheck=1

gpgkey=file:///etc/pki/rpm-gpg/RPM-GPG-KEY-redhat-release

2. 挂在光盘到/mnt: mount /dev/hdc /mnt

3. 执行yum update 来 升级yum库。

4. 用yum安装apache,mysql和php等,命令如下

yum -y install httpd mysql mysql-server mysql-connector-odbc

yum -y install php php-mysql php-common php-pdo

5. 安装绘图工具:rrdtool

./configure --prefix=/usr/local/rrdtool&&make&&make install

ln -s /usr/local/rrdtool/include/rrd.h /usr/include/rrd.h

ln -s /usr/local/rrdtool/lib/librrd.a /usr/lib/librrd.a

6. 安装ganglia

./configure --prefix=/usr/local/ganglia --sysconfdir=/etc/ganglia --with-gmetad

如果该步骤没有报错,则显示

clip_image004

(如果有报错,注意下面的提示),然后make;make install就可以了

温馨提示:其中可能会报错:

configure: errorr: apr-1-config binary not found in path

解决方法:

yum –y install apr

yum -y install apr-util*

报错

libconfuse not found

解放方法:

安装libconfuse-2.5-4.el5.i386.rpm libconfuse-devel-2.5-4.el5.i386.rpm(如果是64位的操作系统,要下载64位的软件包)

7.如果软件安装成功的话,做下面的步骤(提示:下面的命令可以同时拷贝,粘贴一下就可以了,哈哈)

cd /soft/ganglia-3.1.1/

mkdir -p /var/www/html/ganglia/

cp -a web/* /var/www/html/ganglia/ #网页内容

cp gmetad/gmetad.init /etc/rc.d/init.d/gmetad #下面四步是添加系统服务

cp gmond/gmond.init /etc/rc.d/init.d/gmond

chkconfig --add gmetad

chkconfig --add gmond

mkdir /etc/ganglia #生成被监控端的配置文件

gmond/gmond -t | tee /etc/ganglia/gmond.conf &>/dev/null

cp gmetad/gmetad.conf /etc/ganglia/ #生成服务器端的配置文件

mkdir -p /var/lib/ganglia/rrds #存放rrdtool数据的目录

chown nobody:nobody /var/lib/ganglia/rrds

7. gmetad.conf是服务器端的配置文件,其中里面最重要的参数是data_source,他是来定义被监控端的。例如:data_source "db1" 192.168.10.1

db1表示集群的名字,后面的ip是是被监控端的ip。Ok,这时候服务器端就可以启动了。

service gmetad restart

注意:这里会有报错:

Starting GANGLIA gmond: [root@localhost rrdtool-1.4.3]# service gmond restart

Shutting down GANGLIA gmond: [FAILED]

Starting GANGLIA gmond:

再执行一次还是这样的结果

解决方法:

修改/etc/init.d/gmetad

把GMETAD=/usr/sbin/gmetad

改为:GMETAD=/usr/local/ganglia/sbin/gmetad

9.启动客户端。

注意这里会有两个报错:

解决方法:

1)修改/etc/init.d/gmond

把GMOND=/usr/sbin/gmond

修改为GMOND=/usr/local/ganglia/sbin/gmond

报错2:(一般虚拟机里面会报这个错,真实环境里面不会)

/usr/local/ganglia/sbin/gmond[31101]: Error creating multicast server mcast_join=239.2.11.71 port=8649 mcast_if=NULL family='inet4'. Exiting.

2)解决方法:

vi /etc/sysconfig/network-scripts/route-eth0

内容:239.2.11.71 dev eth0

重启network: service network restart

10.启动apache. service httpd start

访问http://服务器ip/ganglia,如图

clip_image006

clip_image008



本文转自 gehailong 51CTO博客,原文链接:http://blog.51cto.com/gehailong/631679,如需转载请自行联系原作者

相关实践学习
如何在云端创建MySQL数据库
开始实验后,系统会自动创建一台自建MySQL的 源数据库 ECS 实例和一台 目标数据库 RDS。
全面了解阿里云能为你做什么
阿里云在全球各地部署高效节能的绿色数据中心,利用清洁计算为万物互联的新世界提供源源不断的能源动力,目前开服的区域包括中国(华北、华东、华南、香港)、新加坡、美国(美东、美西)、欧洲、中东、澳大利亚、日本。目前阿里云的产品涵盖弹性计算、数据库、存储与CDN、分析与搜索、云通信、网络、管理与监控、应用服务、互联网中间件、移动服务、视频服务等。通过本课程,来了解阿里云能够为你的业务带来哪些帮助     相关的阿里云产品:云服务器ECS 云服务器 ECS(Elastic Compute Service)是一种弹性可伸缩的计算服务,助您降低 IT 成本,提升运维效率,使您更专注于核心业务创新。产品详情: https://www.aliyun.com/product/ecs
相关文章
|
6月前
|
监控 算法 Java
【深度挖掘Java性能调优】「底层技术原理体系」深入探索Java服务器性能监控Metrics框架的实现原理分析(Gauge和Histogram篇)
【深度挖掘Java性能调优】「底层技术原理体系」深入探索Java服务器性能监控Metrics框架的实现原理分析(Gauge和Histogram篇)
91 0
|
2月前
|
存储 弹性计算 运维
自动化监控和响应ECS系统事件
阿里云提供的ECS系统事件用于记录云资源信息,如实例启停、到期通知等。为实现自动化运维,如故障处理与动态调度,可使用云助手插件`ecs-tool-event`。该插件定时获取并转化ECS事件为日志存储,便于监控与响应,无需额外开发,适用于大规模集群管理。详情及示例可见链接文档。
|
2月前
|
存储 监控 Linux
监控Linux服务器
详细介绍了如何监控Linux服务器,包括监控CPU、内存、磁盘存储和带宽的使用情况,以及使用各种系统监控工具如vmstat、iostat、sar、top和dstat来分析系统性能,并推荐了一些开源监控系统。
49 0
监控Linux服务器
|
3月前
|
Prometheus 监控 Cloud Native
Web服务器的日志分析与监控
【8月更文第28天】Web服务器日志提供了关于服务器活动的重要信息,包括访问记录、错误报告以及性能数据。有效地分析这些日志可以帮助我们了解用户行为、诊断问题、优化网站性能,并确保服务的高可用性。本文将介绍如何使用日志分析和实时监控工具来监测Web服务器的状态和性能指标,并提供具体的代码示例。
364 0
|
3月前
|
监控 Linux 测试技术
|
6月前
|
弹性计算 监控 安全
【阿里云弹性计算】ECS实例监控与告警系统构建:利用阿里云监控服务保障稳定性
【5月更文挑战第23天】在数字化时代,阿里云弹性计算服务(ECS)为业务连续性提供保障。通过阿里云监控服务,用户可实时监控ECS实例的CPU、内存、磁盘I/O和网络流量等指标。启用监控,创建自定义视图集中显示关键指标,并设置告警规则(如CPU使用率超80%),结合多种通知方式确保及时响应。定期维护和优化告警策略,利用健康诊断工具,能提升服务高可用性和稳定性,确保云服务的卓越性能。
247 1
|
6月前
|
运维 监控 Linux
提升系统稳定性:Linux服务器性能监控与故障排查实践深入理解与实践:持续集成在软件测试中的应用
【5月更文挑战第27天】在互联网服务日益增长的今天,保障Linux服务器的性能和稳定性对于企业运维至关重要。本文将详细探讨Linux服务器性能监控的工具选择、故障排查流程以及优化策略,旨在帮助运维人员快速定位问题并提升系统的整体运行效率。通过实际案例分析,我们将展示如何利用系统资源监控、日志分析和性能调优等手段,有效预防和解决服务器性能瓶颈。
|
6月前
|
监控 Java Linux
使用jvisualVM监控远程linux服务器上运行的jar程序
使用jvisualVM监控远程linux服务器上运行的jar程序
41 5
|
6月前
|
弹性计算 监控 Shell
监控HTTP 服务器的状态
【4月更文挑战第29天】
60 0
|
6月前
|
弹性计算 运维 监控
监控 HTTP 服务器的状态(测试返回码)
【4月更文挑战第28天】
64 0