实现ganglia与centreon的无缝整合

本文涉及的产品
日志服务 SLS,月写入数据量 50GB 1个月
简介: 一、前言二、实现Ganglia与Centreon的完美整合三、告警历史四、统一监控系统架构图

实现gangliacentreon的无缝整合

 

目录:

一、前言

实现GangliaCentreon的完美整合

告警历史

统一监控系统架构图

 

 

一.   前言

check_ check pgsql

[root@locaThostplugins]#1 fping 1check_ganglia_metric.py.

-rwxr-xr-x 1 root_root 2857 Mar 30 i8:i6 check _gang1ia_metric.py

Usage:_check_ganglia metric -hl--host= -m|--metric=-wl--warning=-c/critica[root@localhost plugins]#pwd

7usr/ibfnagios/plugins

[root@1oca1hostplugins]#./check_gang1ia_metric.py-h 192.168.81.233 -m disk_free -w 1000 -c 200CHECKGANGLIA Ok:"disk_free is 96.09

[root@1ocaThostplugins]#cd /usr/1ib64/nagios/plugins/[rootQlocalhostplugins]#Ts

checknrpe._.-.[rootaiocalhostplugins]#77

total 36

-rwxr-xr-x_1nagiosnagios33692Ju122013check_nrpe[root@iocalhostplugins]#

 

所有的服务不可以通过所介绍的两个插件去实现,其上为其中一个插件。

 

同时可以自我创建,或采用网络上提供的方案(如下)。

现有方案,推荐两个现成的数据提取脚本:

 

Python版本: http://www.ivey.com/ganglia/check ganglia metric.py.txt

P

hp版本:http://www.iivey.com/ganglia/check ganglia metric.php.txt

 

 

二. 实现GangliaCentreon的完美整合

通过Python的一个插件。以及通过自我写取插件,进行查验。
Ø熟悉ganglia 作为一个数据所具备的存储功能机制,进行之后一系列书写,作为一个脚本,实现检查。


Ganglia
在默认情况之下,数据更新为十秒一次。频率相对较高。基本可以满足监控需求。


Ø对于服务的监控,若服务器过少,则没有任何问题。若服务器很多,服务器可以监控到,但服务故障长达一个小时之久。才可以收到报警信息。这种状态表明监控服务过多。获取状态值慢。导致信息延迟。那么报警则失去原本的意义。


Ø若使用ganglia ,则不会出现如上情况,数据提取在本地完成,不需经过任何网络。效率十分高效。

 

三. 告警历史

 

如图方式进入查看。

image.png

 

通过此平台。查看很多第三方插件。
例如:Elk
ELk
实质是对服务器的日志进行收集。同样也可将其收集到此平台。
点击进入Syslog ,可以查看多数数据。

 

即服务器内部有多少数据可以在此平台看出:

这便是第三方的一个模块,这就是所谓日志分析功能。

image.png

 

现如下进行一个top操作:

192.168.81.236中进行

[root@host236]#top

正常输入完指令之后,会在平台内部打印出

刷新时长10秒一次

结果如下:

image.png

 

依据上述操作即可,看是否使用符合。

关于是否成型安装文档,相关文档于下方可知:

 

Centreon安装配置实录(超详细)

Centreon是一款功能强大的分布式IT监控系统,它通过第三方组件可以实现对网络、操作系统和应用程序的监控︰

首先,它是开源的,我们可以免费使用它;其次,它的底层采用nagios作为监控软件,

同时nagios通过ndoutil模块将监控到的数据定时写入数据库中,而Centreon实时从数据库读取该数据并通过Web界面展现监控数据﹔,最后,我们可以通过Centreon管理和配置nagios,或者说Centreon就是nagios的一个管理配置工具,通过Centreon提供的Web配置界面,可以轻松完成nagios的各种繁琐配置。

 

包括:

Centreon数据库功用介绍

CES安装步骤

centreon双系统部署流程

Nagios for WAS.

 

例:CES安装步骤

安装central主服务器

1.通过官方镜像安装CES central服务器和poller服务器,下载连接如下.

http://www.centreon.com/Content-Download/download-centreon-enterprise-server

 

2.  从光盘启动服务器,按提示安装。

选择全新安装

Helcome to CES 3.21

Install or upgrade an exist ing system

Insta 1 1 system with bas ic U ideo dr iver

Rescue instal led systen

Boot from1 oca 1 dr iue

Menory test

Press [Tab] to edit opt i ons

utomat ic boot in 49 seconds.

 image.png

 

选择储存类型

此时会有-一个警告,选yes

为服务器起名字。并设置IP地址。

此例中-

Hostname: ces3

IPv4地址: 192.168.1.1/24

GW: 192.168.1. 254

image.png

选择时区- Asia/Shanghai

 image.png

输入root密码后,会出现以下画面,选择第二个。

如果需要进行自定义的LVM设置,可以

选择最后-一个Create Custom Layout.

image.png

 

确认后,等待片刻,出现以下画面,选择Centreon Server with database.

 

说明:

Central server with database :安装centreon (网页服务以及数据库)oentreon-engine

以及centreon- broker.

Central server without database :安装centreon ( 网页服务,不装数据库),

centreon-engine以及centreon-broker.

Pollerserver:仅仅安装centreon-engine

Databaseserver:仅仅安装数据库服务器

image.png

 

安装过程会持续几分钟

完成后按reboot重启

从网页配置Centreon

重启系统完毕后,从浏览器打开http://[SERVER IP]

image.png

 

向导会自动检查模块安装情况

image.png

选择监控引擎为centreon-engine

此处无需修改,直接NEXT

选择BrokerCe ntreon-broker

此处无需修改,直接NEXT

image.png

设置网页端管理员密码以及身份信息,此例中帐号/密码设置为admin/centreon.

image.png

 

数据库设置:

设置数据库root 密码。

设置Database User Name以及密码,此帐号为Centreon连接数据库用。

 

等待几分钟,安装程序会初始化数据库,完成后看到以下画面。

 

等待几分钟,安装程序会初始化数据库,完成后看到以下画面。

image.png

最后,按finish完成安装。

image.png

现在可以从网页登陆了。

 

admin帐号登陆后,进入Configurations - Centreon,检查pollerrunning状态,如果

显示为no,作以下动作将服务重启。

#/etc/init.d/centstoage restart

#/etc/init.d/cencore restart

#/etc/init.d/cbd restart

#/etc/init.d/centrengine restart

 

以上操作完成后,确认tcp5668端口处于监听状态。

如果以上都没有问题, central poller将会处于running态。可以检查centreonnagioslog文件进行问题排查。

 

例:安装poller服务器

1. 使用相同的镜像进行poller安装,安装时选择poller, 监 控引擎选择Centreon engine

此处选择PollerServer, 其他过程与centreon一致。

 

   2.安装完毕后,将poller服务器链接到central服务器中。步骤如下,

 

●增加密钥认证

(1) centreon帐户在centreon服务器上生成SSH认证密钥。

# su- centreon

$ ssh-keygen

Ge nerati ng public/ private rsa key pair.

Enter file in which to save the key

(/var/spool/centreon/.ssh/id_ rsa):

Created directory '/var/spool/centre on/ .ssh'.

Enter passphrase (empty for no pass phrase):

Enter same passphrase again:

Your identification has been saved in /var/spool/ce ntreon/.ssh/id_ rsa.

Your public key has been saved in /var/spool/centreon/. ssh/id_ rsa.pub.

 

(2)  将密钥从centren拷贝至远程poller服务器,$ ssh-copy-id -i~/.ssh/id_ rsa.pub centreon@{IP_ ADDRESS}

 

(3)  完成后, 尝试从central建立ssh连接登陆远程poller。如果不需要输入密码,则验证成功。

 

Sssh ce ntreon@{IP_ ADDRESS}

 

●在 centreon中添加poller

(1)  用管理员登陆centreon后进入Configuration -> Centreon -> Pollers -> Add.按照实际情况填入相关信息.

 

注意:IP Address为远程pollerIP地址( 192.168.2.2), poller类型为centreon engine.

其他设置与默认poller(127.0.0.1)保持一致。

 

(2)接下来配置Borker 。进入Configuration - Centreon

-CentreonBroker-Configuration,使用Add with wizard

image.png

选择Simple Poller

Configuration name可以随便写

Requester选择刚才新建的poller

Crental address填写centreon主机的地址

 

3)确认后会生成- -个新的broker配置,点击打开,进入output选项卡,确认配置如下。

注意: Output1 中需填写ce ntralIP

确认后,回到General选项卡,将状态改为Eanbled,最后保存。

 

(4)进入 Configuration > Monitoring Engines > Main.cfg,选中Centreon Engine CFG 1,选择more actions,然后duplicate-个 新的CFG

 

(5)点击新的 CFG进行配置,在File选项卡中,为新的配置起-一个名称,uinked poller,选择刚才新建的poller。 其余保持默认。

Check Options选项卡中,将Aggressive Host Checks设置为No

 

(6)进入 Centreon-Monitoring engines - Generate,如下图选择后,点击Export

image.png

 

(7)进入ConfigurationCentreon,确认新增的poller 状态。

如果poller不处于running状态,请登陆poller 以及centreon,分别检查以下日志(如果日志存在),然后针对错误信息进行处理。

/var/log/ce ntreon-engine/centengine.log

/var/log/ce ntreon/ce ntcore.log

/var/log/ce ntreon/ce ntstorage .log

/var/log/ce ntreon/sql-error.log

/var/log/ce ntreon-broker/*.log

 

 

(8)至此,centralpoller的配置就完成,如需添加更多poller, 可以重复以上过程。

 

配置邮件报警

邮件报警需要在每台poller_上启用,过程如下:

1.安装报警脚本,我们使用sendEmail来进行报警,优势在于可以使用远程的SMTP

服务器进行报警邮件发送。

#yum install sendEmail

或者从官网下载:

http://caspian. dotconf.net/menu/Software/SendEmail

2.配置报警command

进入configuration-comm and-notification

 

分别配置hostservice的报警命令:

Host:黄色为程序路径,绿色为SMTP服务器地址

/tmp/se ndEmail-v 1.56/send Email

-f alert@oentreon.com -t SCONTACTEMAIL$

 

SNOTIFICATIONTYPE$ Service Alert: SSE RVICENAMES is SSERVICESTATE$ *" -m ****** centreon

Notification

** ***\n\nN otifi cation

Type:

$NOTIFICATIONTYP E$\n\nService :

SSERVICEDESC$\n Host:

SHOSTALIASS\nAddress:

$HOSTADDRESSS\nState:

$SERVICESTATES\n\nDate/Time:

$DATE$

Ad ditional

Info

$SERVICEOUTPUT$\n$SERVICENAME$ is $SERVICESTATE$" -s 192.168.0.55:25

Service:黄色为程序路径,绿色为SMTP服务器地址

/tmp/sendEmail-v 1.56/send Email

-f alert@centreon.com -t SCONTACTEMAILS

-u“**

SNOTIFICATIONTYPE$ Service Alert: $SERVICENAME$ is $SERVICESTATES本本" . -m“***** centreon

Notification

*****\n\nN otifi cation

Type:

SNOTIFICATIONTYPE$\n\nService:

$SERVICEDESCS\n Host:

$HOS TALIASS\nAddress:

$HOS TADDRESS$\nState:

SSERVICESTATES\n\nDate/Time:

$DATES

Additional

Info

:

$SERVICEOUTPUT$\n$SERVICENAME$ is $SERVICESTATE$"-s 192.168.0.55:25

3.将报警命令与用户做关联

进入Configuration - Users',编辑'admin'的报警命令关联。

4.然后,与该用户关联的服务或者主机出问题后,会发送报警到该用户的邮箱。

 

四. 统一监控系统架构图

  • 由图可知:最前端,Web管理平台。基于central的管理平台。平台下方有ganglia的服务端,与central的服务端组成一块。ganglia的服务端gmetad,最高等级模块会前往下一级gmetad平台数据的拉取。每一个class相当于一个异地的机房,每个机房内部结构,服务端进行拉取数据。汇聚之后,在最终管理端汇总。


  • ganglia服务端可以分为多级,gmetad客户端也可分级。每一个应用上的布局不同,可以将其分级。通过多级方式进行部署,在每个机房之间。数据传输方式也可多分组。

 

  • 若所有数据均汇入北京机房。则所有数据在一个服务器内,则服务器存在单点故障问题,则数据会消失。则可以对一级的ganglia做双击设备,平等分出另一个备机,备机的数据并非通过主机传输。通过与主机一样的方式。与全国各地机房进行接点数据获取。则总的数据中心保留两份。


若第一级别管理,出现故障可转向第二级别,实现无缝转移。

 image.png

 

Cluster1-N均为一个分布式集群,也可以认为是-个机房数据中心。

每个数据中心的Node server 都运行一一个Gmond守护进程,进行数据收集,将收集到的数据汇总到Gangliaproxy主机,Gangliaproxy主机上运行着Gmetad守护进程。

同时Ganglia proxyNode server都加载通过c或者Python编写的Ganglia 插件,打展Ganglia 监控功能。

Managerserver
是一一个管理 主机,主要用于收集从各个机房数据中心的监控数据,通过数据抽取模块将NagiosGanglia整合到一起,考虑到数据的安全性,Manager server 建议做一个备机,平时主机和备机同时工作,进行数据收集,主机故障时,自动切换到备机,保证管理主机高可用。

监控数据和报表通过Web方式展示出来,将NagiosGangliaweb进行整合,并作二次开发,通过一个统一的界面展示监控状态和报表信息。

相关实践学习
日志服务之使用Nginx模式采集日志
本文介绍如何通过日志服务控制台创建Nginx模式的Logtail配置快速采集Nginx日志并进行多维度分析。
相关文章
|
6月前
|
存储 监控 Linux
Flume【部署 02】Flume监控工具Ganglia的安装与配置(CentOS 7.5 在线安装系统监控工具Ganglia + 权限问题处理 + Flume接入监控配置 + 图例说明)
【2月更文挑战第17天】Flume【部署 02】Flume监控工具Ganglia的安装与配置(CentOS 7.5 在线安装系统监控工具Ganglia + 权限问题处理 + Flume接入监控配置 + 图例说明)
189 1
Flume【部署 02】Flume监控工具Ganglia的安装与配置(CentOS 7.5 在线安装系统监控工具Ganglia + 权限问题处理 + Flume接入监控配置 + 图例说明)
|
6月前
|
存储 监控 Linux
Ganglia【部署 01】Flume监控工具Ganglia的安装与配置(CentOS 7.5 在线安装系统监控工具Ganglia + 权限问题处理 + Flume接入监控配置 + 图例说明)
Ganglia【部署 01】Flume监控工具Ganglia的安装与配置(CentOS 7.5 在线安装系统监控工具Ganglia + 权限问题处理 + Flume接入监控配置 + 图例说明)
113 0
|
6月前
|
存储 Web App开发 监控
Ganglia【部署 02】ganglia-3.7.2 系统监控离线安装(由于问题较多未整理完成暂作记录用)
Ganglia【部署 02】ganglia-3.7.2 系统监控离线安装(由于问题较多未整理完成暂作记录用)
114 0
|
机器学习/深度学习 数据采集 监控
实现ganglia与centreon的无缝整合| 学习笔记
快速学习实现ganglia与centreon的无缝整合。
实现ganglia与centreon的无缝整合| 学习笔记
|
数据采集 运维 监控
配置centreon监控系统| 学习笔记
快速学习配置centreon监控系统。
配置centreon监控系统| 学习笔记
|
数据采集 监控 关系型数据库
配置centreon监控系统
一. 前言 二. 配置centreon监控系统 三.Ganglia与Centreon的无缝整合
配置centreon监控系统