Zabbix服务器端安装过程(含centos 7.1安装 zabbix3.0.8的故障排除)

本文涉及的产品
RDS MySQL Serverless 基础系列,0.5-2RCU 50GB
云数据库 RDS MySQL,集群系列 2核4GB
推荐场景:
搭建个人博客
日志服务 SLS,月写入数据量 50GB 1个月
简介:

Task 7

 目标:监控线上服务的正常运行

 意义:了解运维的另一份重要职责,系统监控

 步骤:1.安装zabbix                  2.配置监控任务7的Web项目

 要求:1.停止服务之后,发出报警邮件 

                  2.启动服务之后,发出故障恢复邮件                  

                  3.查看系统的其他负载。了解CPU,IO,内存的使用率。超过设定阈值之后报警。

 掌握技能:     

   1.zabbix的配置 2.邮件发送的配置 3.了解服务器的基本状况



http://www.osyunwei.com/archives/7984.html,这就是安装及汉化的全部过程,感谢先人栽树!


这篇文章写的已经很到位了,一步一步按着来肯定能安装完毕,不过要注意他的Nginx安装包不是官方下载的,而是lnmp的包,如果是官方下载的话,需要在.conf那里多改一点东西。


这里面有几个细节问题,原作者没有说,都是发生在网页调试阶段

1)http://本地ip/zabbix/setup.php 网页打不开

将lnmp的nginx.conf中的local位置改成setup.php的目录,即由原来的/home/wwwroot/default改成/usr/local/nginx/html/。这样配置文件会默认打开新的路径并且找到index.html,同时在这个路径下输入/zabbix/setup.pjp也是可读的。

2)下一步,即Check of pre-requisites这步会有红字错误,文中作者说是要改/etc/php.ini,其实不对,#find / -name php.ini一下就会发现,其实有两个php.ini,需要改的其实是/usr/local/php/etc/php.ini,如图:

wKiom1ac6ZOQNes6AABs4_Sn-zI879.png

wKioL1ac6c3TW-_uAAA1eJAlyfo145.png

改完之后,需要#service php-fpm reload一下,然后刷新一下网页就能看到,配置文件里改成了303,而网页显示的也是303,这证明了这个php.ini才是真的需要更改的配置文件,其实改成300就可以了。


如果Zabbix server is not running怎么办?

#netstat -anp|grep zabbix,看看是否有zabbix server的项目,若是没有的话,#service zabbix_server start,这句命令有的机器是#service zabbix-server start

同时要关闭selinux,这玩意我也不知道美国国家安全局发明它有啥用,貌似我接触的运维软件都是要关闭这个的。#vim /etc/selinux/conf,然后将SELINUX = disabled。


还有一种超级情况,就是这样:

1453139461_601125.png明明启动了zabbix_server,但是检查端口的使用,却没有server这个服务,可见server根本没有启动,如果你使用#service zabbix_server restart,会发现shutdown那一步是“失败”的。


出现这种情况第一件事先检查mysql的服务器是否打开,#service mysql start,如果依旧,那就调用启动日志。默认的启动日志是/tmp/zabbix_server.log,vim了它,发现出现这样的字样:

wKioL1aeA2Wz0faeAAAfg4ja00o599.png说链接mysql的zabbix数据库失败,那么就要返回去zabbix的配置文件,看一下用户名和密码是否填写正确,默认的zabbix的配置文件在/user/local/zabbix/etc/zabbix_server.conf,vim一下,找到DBname,这个是zabbix,不要改,DBuser这个是mysql的登录名,DBpasswd这个就是登陆的密码。


我这个情况很奇怪,我使用账号zabbix和对应的密码是可以登录mysql的,但是SHOW DATABASES一下却看不到这个zabbix的数据库,而使用root账号登陆却是有的,我想是用户权限出了问题。于是我把zabbix_server.conf的DBuser改成root,密码也对应更改,就提示OK了。


情况二:检查日志,zabbix的日志写的比较好,比较通俗,发现日志的内容是这样的:

connection to database 'ZABBIX' failed: [2002] Can't connect to local MySQL server through socket '/var/lib/mysql/mysql.sock' (2)

 26986:20160707:092553.068 Database is down. Reconnecting in 10 seconds.

由于我这次设置的数据库叫ZABBIX,区分大小写。所以第一时间要登陆mysql,然后使用SHOW DATABASESE;这个命令检查一下这个账户和密码是否能看到ZABBIX这个数据库,如果没有,就CREATE DATABASE ZABBIX;建立ZABBIX数据库。


建立完毕,还是提示连接不上,那么就去zabbix_server.log里检查一下DBName和DBPasswd是否正确,顺便再去zabbix.conf.php检查一下,如果不正确,请按设定更改,然后#service zabbix_server restart。


如果还不正确,那就是socket的问题,#ps auxwww|grep mysql,检查一下看一下mysql的socket,比如这台机器检查到mysql的情况如下:

wKioL1d9sjvB01vjAAA8StuU-28489.png看到配置的socket位置是/tmp/mysql.sock,而不是日志写的/var/lib/mysql/mysql.sock,于是乎,来到zabbix_server.conf里更改如下:

wKioL1d9suOCCwZTAAAcQJ2k03s766.png


然后重启zabbix_server服务即可。


==========================================分割线======================================

centos7.1 通过yum安装 zabbix 3.0的方法主要参考:http://www.cnblogs.com/hanyifeng/p/5353068.html


这里说一点其他地方的坑:

1)Requires: libnetsnmp.so.20()(64bit)的错误:

# yum install zabbix-agent zabbix-server zabbix-server-pgsql -y
...
Error: Package: zabbix-server-pgsql-2.4.1-1.el6.x86_64 (zabbix)
           Requires: libnetsnmp.so.20()(64bit)

# yum provides libnetsnmp* --showduplicates | grep -w libnetsnmp
Provides    : libnetsnmp.so.31
Provides    : libnetsnmp.so.31()(64bit)
Provides    : libnetsnmp.so.31()(64bit)

找我要libnetsnmp.so.20()(64bit),但是7.1已经没有20()了,那么就去/etc/yum.repos.d/zabbix.repo这个文件里,把下面两行更改一下:

1
2
baseurl=http: //repo .zabbix.com /zabbix/2 .4 /rhel/6/ $basearch/
baseurl=http: //repo .zabbix.com /non-supported/rhel/6/ $basearch/

更改成

1
2
baseurl=http: //repo .zabbix.com /zabbix/2 .4 /rhel/7/ $basearch/ 
baseurl=http: //repo .zabbix.com /non-supported/rhel/7/ $basearch/


2)启动zabbix的时候会启动失败,这个时候需要先把seforce停止,然后安装下面两个东西:

[root@test ~]# yum install trousers -y
[root@test ~]# yum install gnutls -y



3)进入web界面却是下面这样的样子,那是因为这台机器是原机zabbix2.2升级到3.0.8,需要在浏览器把cookie重新清理一下即可:

wKiom1jaFxqyVZjHAAEu6u4mgz8102.png-wh_50



 本文转自 苏幕遮618 51CTO博客,原文链接:http://blog.51cto.com/chenx1242/1736330


相关实践学习
如何快速连接云数据库RDS MySQL
本场景介绍如何通过阿里云数据管理服务DMS快速连接云数据库RDS MySQL,然后进行数据表的CRUD操作。
全面了解阿里云能为你做什么
阿里云在全球各地部署高效节能的绿色数据中心,利用清洁计算为万物互联的新世界提供源源不断的能源动力,目前开服的区域包括中国(华北、华东、华南、香港)、新加坡、美国(美东、美西)、欧洲、中东、澳大利亚、日本。目前阿里云的产品涵盖弹性计算、数据库、存储与CDN、分析与搜索、云通信、网络、管理与监控、应用服务、互联网中间件、移动服务、视频服务等。通过本课程,来了解阿里云能够为你的业务带来哪些帮助     相关的阿里云产品:云服务器ECS 云服务器 ECS(Elastic Compute Service)是一种弹性可伸缩的计算服务,助您降低 IT 成本,提升运维效率,使您更专注于核心业务创新。产品详情: https://www.aliyun.com/product/ecs
相关文章
|
3月前
|
存储 数据挖掘 Windows
服务器数据恢复—V7000存储raid5故障导致LUN无法访问的数据恢复案例
服务器数据恢复环境: 三台V7000存储,共有64块SAS硬盘(其中有三块热备盘,其中一块已启用)组建了数组raid5阵列。分配若干LUN,上层安装Windows server操作系统,数据分区格式化为NTFS文件系统。 服务器故障: V7000存储中有多块硬盘出现故障离线,阵列失效,LUN无法访问。需要恢复卷中所有数据(主要为dcm文件)。
|
3月前
|
存储 数据挖掘 虚拟化
服务器数据恢复—Raid5阵列两块硬盘硬件故障掉线的数据恢复案例
服务器数据恢复环境: 一台某品牌存储设备上有一组由10块硬盘(9块数据盘+1块热备盘)组建的raid5阵列,上层部署vmware exsi虚拟化平台。 服务器故障: raid5阵列中两块硬盘对应的指示灯亮黄灯掉线。硬盘序列号无法读取,通过SAS扩展卡也无法读取。
|
16天前
|
存储 数据挖掘
服务器数据恢复—V7000存储上多块Mdisk成员盘出现故障的数据恢复案例
服务器存储数据恢复环境: 一台V7000存储上共12块SAS机械硬盘(其中1块是热备盘),组建了2组Mdisk,创建了一个pool。挂载在小型机上作为逻辑盘使用,小型机上安装的AIX+Sybase。 服务器存储故障: V7000存储中磁盘出现故障,管理员发现问题后立即更换磁盘。新更换的硬盘在上线同步数据的时候,存储上另一块磁盘也出现问题,导致逻辑盘无法挂接在小型机上,业务暂时中断。V7000存储的管理界面上显示两块硬盘故障脱机。 pool无法加载,其中三个通用卷均无法挂载。
|
30天前
|
运维 监控 负载均衡
slb后端服务器故障
slb后端服务器故障
45 13
|
2月前
|
监控 数据可视化 BI
服务器监控软件Zabbix
【10月更文挑战第19天】
58 6
|
3月前
|
NoSQL Linux Redis
在 centos7 下重启/开启 redis 服务器
本文提供了一种在Centos 7操作系统下如何重启Redis服务器的步骤,包括停止Redis服务、确认停止成功以及重新启动Redis服务。
189 2
在 centos7 下重启/开启 redis 服务器
|
2月前
|
存储 Unix Linux
服务器数据恢复—DELL EqualLogic PS6100系列存储简介及发生故障后的处理方案
DELL EqualLogic PS6100系列存储采用虚拟ISCSI SAN阵列,支持VMware、Solaris、Linux、Mac、HP-UX、AIX操作系统,提供全套企业级数据保护和管理功能,具有可扩展性和容错功能。
|
3月前
|
监控 网络协议 安全
DNS服务器故障不容小觑,从应急视角谈DNS架构
DNS服务器故障不容小觑,从应急视角谈DNS架构
74 4
|
3月前
|
运维 安全 Linux
IDC服务器故障排除思路
本文详细介绍了服务器维修流程,包括维修前的工具和备件准备,以及不拆机情况下的初步检查步骤。文中还提供了拆机维修的具体方法,如最小化测试法、替换法和交叉比较法,并针对CPU、主板、内存、硬盘、电源、风扇、网卡及BMC等主要配件的故障排除进行了说明,强调了注意事项,旨在帮助技术人员快速准确地定位并解决问题。
133 13
ly~
|
3月前
|
缓存 监控 安全
反向代理服务器的常见故障有哪些?
反向代理服务器常遇到的故障包括配置错误、网络问题、性能瓶颈及安全漏洞。配置相关故障如错误监听端口、域名配置不当及代理转发规则错误,可使用`netstat -tuln`检查端口状态,并验证域名及DNS解析。网络故障涉及连接中断和带宽不足,利用`ping`和`traceroute`检测连通性,用`iftop`监控带宽。性能问题如资源耗尽和缓存不一致需通过`top`监控资源使用,并检查缓存策略。安全故障包括DDoS攻击和配置漏洞,应使用流量分析工具检测异常并加强安全配置,确保SSL/TLS加密和访问控制策略正确无误。
ly~
200 3