作者:尹正杰
版权声明:原创作品,谢绝转载!否则将追究法律责任。
一.Zabbix 5.0 LTS部署实战篇
我们通常在部署zabbix server时通常会顺便在该主机上部署一个zabbix agent,如下图所示,我们可以在web界面上看到默认的zabbix server的监控信息,这都是由zabbix agent端采集的数据。
zabbix agent端的部署相对来说就比较简单啦,只需要三步即可完成:
(1)配置zabbix的软件源;
(2)安装zabbix agent;
(3)配置zabbix agent端的配置文件并启动服务即可。
博主推荐阅读:
https://www.cnblogs.com/yinzhengjie/p/12251180.html
二.部署zabbix agent
1>.实验环境说明
hadoop101.yinzhengjie.com:
Zabbix Agent
hadoop102.yinzhengjie.com
Zabbix Agent
hadoop103.yinzhengjie.com
Zabbix Agent
hadoop104.yinzhengjie.com
Zabbix Agent
hadoop105.yinzhengjie.com
Zabbix Server,httpd,rh-php72-php-fpm
温馨提示:
关于角色分配如上图所属,所有节点均采用RedHat公司发布的CentOS 7.6的操作系统,其配置信息如下图所示。
2>.所有节点安装官方的软件源
[root@hadoop101.yinzhengjie.com ~]# rpm -Uvh https://repo.zabbix.com/zabbix/5.0/rhel/7/x86_64/zabbix-release-5.0-1.el7.noarch.rpm
温馨提示:
如下图所示,所有节点均需要安装zabbix软件源,它除了生成zabbix.repo文件外,还会帮咱们下载2个用于校验的文件(即"/etc/pki/rpm-gpg/RPM-GPG-KEY-ZABBIX"和"RPM-GPG-KEY-ZABBIX-A14FE591")。
当然,你也可以选择不执行该步骤,这意味着你需要修改zabbix.repo文件将所有的gpgcheck的默认值由1改为0,即禁用rpm包的校验功能。
3>.将zabbix官方的软件源地址切换为国内阿里的软件源并分发到其他节点
[root@hadoop101.yinzhengjie.com ~]# cat /etc/yum.repos.d/zabbix.repo # 修改后的配置文件如下所示。
[zabbix]
name=Zabbix Official Repository - $basearch
baseurl=http://mirrors.aliyun.com/zabbix/zabbix/5.0/rhel/7/$basearch/
enabled=1
gpgcheck=1
gpgkey=file:///etc/pki/rpm-gpg/RPM-GPG-KEY-ZABBIX-A14FE591
[zabbix-frontend]
name=Zabbix Official Repository frontend - $basearch
baseurl=http://mirrors.aliyun.com/zabbix/zabbix/5.0/rhel/7/$basearch/frontend
enabled=1
gpgcheck=1
gpgkey=file:///etc/pki/rpm-gpg/RPM-GPG-KEY-ZABBIX-A14FE591
[zabbix-debuginfo]
name=Zabbix Official Repository debuginfo - $basearch
baseurl=http://mirrors.aliyun.com/zabbix/zabbix/5.0/rhel/7/$basearch/debuginfo/
enabled=1
gpgkey=file:///etc/pki/rpm-gpg/RPM-GPG-KEY-ZABBIX-A14FE591
gpgcheck=1
[zabbix-non-supported]
name=Zabbix Official Repository non-supported - $basearch
baseurl=http://mirrors.aliyun.com/zabbix/non-supported/rhel/7/$basearch/
enabled=1
gpgkey=file:///etc/pki/rpm-gpg/RPM-GPG-KEY-ZABBIX
gpgcheck=1
[root@hadoop101.yinzhengjie.com ~]#
[root@hadoop101.yinzhengjie.com ~]# for host in `seq 102 104`; do scp /etc/yum.repos.d/zabbix.repo hadoop${host}.yinzhengjie.com:/etc/yum.repos.d/zabbix.repo; done;
温馨提示:
如下图所示,执行for循环时调用了scp命令,该命令需要当前主机与其他主机免密登录,避免交互式界面。
我这里只将配置文件分发到hadoop[102-104].yinzhengjie.com节点,疑问hadoop101.yinzhengjie.com和hadoop105.yinzhengjie节点已经有zabbix的软件源文件啦~
4>.所有节点安装zabbix agent
[root@hadoop101.yinzhengjie.com ~]# yum -y install zabbix-agent # 在当前节点安装zabbix agent服务
[root@hadoop101.yinzhengjie.com ~]#
[root@hadoop101.yinzhengjie.com ~]# tail -17 /etc/ansible/hosts
#Add by yinzhengjie for Hadoop.
[nn]
hadoop101.yinzhengjie.com
[snn]
hadoop105.yinzhengjie.com
[dn]
hadoop102.yinzhengjie.com
hadoop103.yinzhengjie.com
hadoop104.yinzhengjie.com
[other]
hadoop102.yinzhengjie.com
hadoop103.yinzhengjie.com
hadoop104.yinzhengjie.com
hadoop105.yinzhengjie.com
[root@hadoop101.yinzhengjie.com ~]#
[root@hadoop101.yinzhengjie.com ~]# ansible dn -m shell -a "yum -y install zabbix-agent" # 在所有节点上安装zabbix agent服务。
5>.修改集群所有主机的zabbix agent的配置文件,指定zabbix server地址
[root@hadoop101.yinzhengjie.com ~]# cp /etc/zabbix/zabbix_agentd.conf /etc/zabbix/zabbix_agentd.conf-`date +%F`
[root@hadoop101.yinzhengjie.com ~]#
[root@hadoop101.yinzhengjie.com ~]# sed -r -i 's#(Server=)127.0.0.1#\1hadoop105.yinzhengjie.com#' /etc/zabbix/zabbix_agentd.conf
[root@hadoop101.yinzhengjie.com ~]#
[root@hadoop101.yinzhengjie.com ~]# sed -r -i 's#(Hostname=)Zabbix server#\1hadoop101.yinzhengjie.com#' /etc/zabbix/zabbix_agentd.conf
[root@hadoop101.yinzhengjie.com ~]#
温馨提示:
如下图所示,我仅演示了如何在hadoop101.yinzhengjie.com节点上修改相应的配置文件,在其他节点重复做上面相同的操作,只不过需要注意Hostname对应的主机名应该更换为对应的主机哟~
6>.启动zabbix agent并为它设置开机自启
[root@hadoop101.yinzhengjie.com ~]# systemctl restart zabbix-agent
[root@hadoop101.yinzhengjie.com ~]#
[root@hadoop101.yinzhengjie.com ~]# systemctl enable zabbix-agent
[root@hadoop101.yinzhengjie.com ~]#
[root@hadoop101.yinzhengjie.com ~]# ansible dn -m shell -a "systemctl restart zabbix-agent;systemctl enable zabbix-agent"
三.在zabbix web端添加对zabbix agent的监控
1>.如下图所示,依次点击"Configuration" -> "Host group"
2>.点击"Create host group"
3>.自定义组名
4>.组添加成功后,依次点击"Configuration"->"Host"->"Create Host"
5>.配置Host页面
6>.为主机选择模板
7>.主机添加成功
8>.观察监控的logo是否变为绿色(如下图所示,说明监控是成功的)
9>.重复4-8的步骤,完成集群其他节点的监控
10>.依次点击"Monitoring"->"Hosts"->"Graphs",可以查看对应主机的图形信息
11>.选择要查看图形的时间周期