【运维知识进阶篇】Zabbix5.0稳定版详解9(Zabbix优化:高并发对MySQL进行拆分、Zabbix-agent主动上报模式、使用proxy代理模式、系统自带监控项优化、进程优化、缓存优化)

本文涉及的产品
云数据库 RDS MySQL,集群系列 2核4GB
推荐场景:
搭建个人博客
RDS MySQL Serverless 基础系列,0.5-2RCU 50GB
云数据库 RDS MySQL,高可用系列 2核4GB
简介: 【运维知识进阶篇】Zabbix5.0稳定版详解9(Zabbix优化:高并发对MySQL进行拆分、Zabbix-agent主动上报模式、使用proxy代理模式、系统自带监控项优化、进程优化、缓存优化)

Zabbix在使用的过程中有很多优化的点,可以提高系统性能和使用效率,包括高并发需要对MySQL进行拆分、Zabbix-agent被动上传修改为主动上报模式、服务器的地区较多的情况尽量使用proxy代理模式、系统自带监控项优化、进程优化、缓存优化。

一、高并发需要对MySQL进行拆分

在高并发环境下,单个MySQL实例可能无法处理大量的查询请求。因此,可以考虑将Zabbix数据库进行拆分,以减轻负载。可以通过多个MySQL实例,每个实例负责不同的数据表或区域,从而实现数据库的拆分。

1. 1、分析当前的负载情况,确定是否需要拆分MySQL数据库。
2. 2、准备多个MySQL实例,并为每个实例创建相应的数据库。
3. 3、将Zabbix的数据表根据一定的规则拆分到各个MySQL实例中。可以根据功能模块、地理区域等进行拆分。
4. 4、修改Zabbix服务器和代理的配置文件,使其连接相应的MySQL实例。

二、Zabbix-agent被动上传修改为主动上报模式

默认情况下,Zabbix-agent使用被动上传模式,即等待服务器向其请求数据。但在高负载环境中,被动上传模式可能产生较高的系统负载。所以,将被动上传模式修改为主动上报模式可能会更好,即Zabbix-agent主动将数据发送给Zabbix服务器。

1. 1、修改Zabbix-agent的配置文件,在其中启用主动上报模式。
2. 2、在Zabbix服务器上添加主动监控项,用于接收来自Zabbix-agent的数据。
3. 3、配置主动监控项的触发器和动作,以便在满足特定条件时触发通知。

详细可以参考这篇文章: 【运维知识进阶篇】zabbix5.0稳定版详解6(zabbix自动化监控:自动发现+自动注册+监控项目主动式)_我是koten的博客-CSDN博客

三、服务器的地区较多的情况尽量使用proxy代理模式

当Zabbix服务器和被监控的主机地理位置较远时,网络延迟可能较高,影响数据采集的效率。在这种情况下,可以配置Zabbix Proxy代理来充当中间节点,将代理放置在被监控的主机附近,以减少网络延迟和带宽消耗。

1. 1、在需要进行代理的地区部署Zabbix Proxy代理服务器。
2. 2、配置Zabbix Proxy代理的相关参数,包括连接Zabbix服务器的地址、端口以及需要代理的主机。
3. 3、在被监控的主机上修改Zabbix-agent的配置文件,将其连接到相应的Zabbix Proxy代理服务器。

详细可以参考这篇文章:【运维知识进阶篇】zabbix5.0稳定版详解7(zabbix分布式监控:使用场景+功能详解+快速部署+基本使用)_我是koten的博客-CSDN博客

四、系统自带监控项优化

Zabbix提供了一些系统自带的监控项,但并非每个监控项都适用于所有情况。因此,可以根据实际需求,选择性地启用、禁用或调整这些自带的监控项,以减少不必要的开销。

1. 1、在Zabbix前端界面上,禁用不需要的系统自带监控项。
2. 2、根据需求,自定义监控项,以更准确地监控系统的关键指标。
3. 3、避免在单个主机上同时启用大量监控项,可以分散监控项的负载到多个主机。

详细可以参考这篇文章:

【运维知识进阶篇】zabbix5.0稳定版详解4(用脚本自定义监控项+监控MySQL状态信息)_我是koten的博客-CSDN博客

五、进程优化

对于Zabbix相关的进程,如Zabbix-server、Zabbix-agent等,可以根据系统的实际情况进行调优。例如,可以调整进程的启动参数、最大文件描述符数、线程数等,以提高性能和稳定性。

由于zabbix版本不同,可能有的配置项配置文件没有,自行调整即可。

1. 1. 调整Zabbix-server和Zabbix-agent的启动参数:
2.  - 打开Zabbix-server配置文件(一般为zabbix_server.conf):vim /etc/zabbix/zabbix_server.conf`
3.  - 修改Zabbix-server的启动参数,如调整内存限制为8GB:
4.     ```
5.     StartVMwarePerfFrequency=60
6.     StartJavaGateway=0
7.     JavaGateway=127.0.0.1
8.     JavaGatewayPort=10052
9.     StartHTTPPollers=5
10.     StartPreprocessors=10
11.     StartPollers=100
12.     StartPingers=10
13.     StartDiscoverers=15
14.     ```
15.  - 打开Zabbix-agent配置文件(一般为zabbix_agentd.conf):vim /etc/zabbix/zabbix_agentd.conf
16.  - 修改Zabbix-agent的启动参数,如调整内存限制为2GB:
17.     ```
18.     StartAgents=10
19.     ```
20. 2. 配置操作系统的最大文件描述符数:
21.  - 打开limits.conf文件:vim /etc/security/limits.conf
22.  - 添加以下行以提高文件描述符限制,如每个进程最大打开文件数为65536:
23.     ```
24.     * soft nofile 65536
25.     * hard nofile 65536
26.     ```
27.  - 打开sysctl.conf文件:vim /etc/sysctl.conf
28.  - 添加以下行以提高系统的可打开文件数:
29.     ```
30.     fs.file-max = 200000
31.     ```

六、缓存优化

Zabbix在数据查询和处理过程中使用了内部缓存,以提高性能。通过适当调整缓存大小、缓存时间等参数,可以优化系统的性能;还可以使用外部缓存服务器,如Memcached或Redis,来存储和提供缓存数据,提高响应速度和减轻数据库负载;针对频繁查询的数据,如历史数据和趋势数据等,可以使用缓存策略,减轻数据库负载。

由于zabbix版本不同,可能有的配置项配置文件没有,自行调整即可。

1. 1. 修改Zabbix-server的缓存参数:
2.  - 打开Zabbix-server配置文件:vi /etc/zabbix/zabbix_server.conf
3.  - 修改缓存配置,如增加缓存大小限制和缓存数量,即将以下参数修改为合适的值:
4.     ```
5.     CacheSize=512M
6.     CacheUpdateFrequency=30
7.     StartPollersUnreachable=5
8.     ```
9. 2. 配置使用外部缓存服务器(如Memcached或Redis):
10.  - 根据具体情况,安装并配置Memcached或Redis服务器。(这里以Memcached为例)
11.  - 修改Zabbix-server和Zabbix-agent的配置文件,使其与Memcached服务器进行连接。
12.  - 在Zabbix-server配置文件中添加以下行:
13.       ```
14.       CacheType=CACHE_MEMCACHED
15.       CacheSize=512M
16.       CacheUpdateFrequency=30
17.       StartPollersUnreachable=5
18.       MemcachedCacheSize=256M
19.       MemcachedTimeout=10s
20.       MemcachedLocation=127.0.0.1:11211
21.       ```
22.  - 在Zabbix-agent配置文件中添加以下行:
23.       ```
24.       CachedItemMax=1000
25.       CachedItemSize=128K
26.       ```
27. 3. 重启Zabbix-server和Zabbix-agent服务,使配置生效:
28.  - 重启Zabbix-server服务:systemctl restart zabbix-server
29.  - 重启Zabbix-agent服务:systemctl restart zabbix-agent

我是koten,10年运维经验,持续分享运维干货,感谢大家的阅读和关注!

相关实践学习
如何快速连接云数据库RDS MySQL
本场景介绍如何通过阿里云数据管理服务DMS快速连接云数据库RDS MySQL,然后进行数据表的CRUD操作。
全面了解阿里云能为你做什么
阿里云在全球各地部署高效节能的绿色数据中心,利用清洁计算为万物互联的新世界提供源源不断的能源动力,目前开服的区域包括中国(华北、华东、华南、香港)、新加坡、美国(美东、美西)、欧洲、中东、澳大利亚、日本。目前阿里云的产品涵盖弹性计算、数据库、存储与CDN、分析与搜索、云通信、网络、管理与监控、应用服务、互联网中间件、移动服务、视频服务等。通过本课程,来了解阿里云能够为你的业务带来哪些帮助     相关的阿里云产品:云服务器ECS 云服务器 ECS(Elastic Compute Service)是一种弹性可伸缩的计算服务,助您降低 IT 成本,提升运维效率,使您更专注于核心业务创新。产品详情: https://www.aliyun.com/product/ecs
目录
相关文章
|
3月前
|
运维 Linux Apache
Puppet 作为一款强大的自动化运维工具,被广泛应用于配置管理领域。通过定义资源的状态和关系,Puppet 能够确保系统始终处于期望的配置状态。
Puppet 作为一款强大的自动化运维工具,被广泛应用于配置管理领域。通过定义资源的状态和关系,Puppet 能够确保系统始终处于期望的配置状态。
79 3
|
1天前
|
机器学习/深度学习 运维 监控
利用深度学习进行系统健康监控:智能运维的新纪元
利用深度学习进行系统健康监控:智能运维的新纪元
51 30
|
1月前
|
人工智能 自然语言处理 JavaScript
Agent-E:基于 AutoGen 代理框架构建的 AI 浏览器自动化系统
Agent-E 是一个基于 AutoGen 代理框架构建的智能自动化系统,专注于浏览器内的自动化操作。它能够执行多种复杂任务,如填写表单、搜索和排序电商产品、定位网页内容等,从而提高在线效率,减少重复劳动。本文将详细介绍 Agent-E 的功能、技术原理以及如何运行该系统。
84 5
Agent-E:基于 AutoGen 代理框架构建的 AI 浏览器自动化系统
|
2月前
|
算法 机器人 语音技术
由通义千问驱动的人形机器人具身智能Multi-Agent系统
申昊科技人形机器人小昊,集成通义千问多模态大模型的具身智能系统,旨在讲解销售、迎宾表演等场景。机器人通过语音、动作等方式与用户互动,利用云端大语言模型处理自然语言,结合视觉、听觉等多模态感知技术,实现流畅的人机对话、目标追踪、展厅讲解等功能。
237 4
由通义千问驱动的人形机器人具身智能Multi-Agent系统
|
2月前
|
缓存 运维 监控
【运维必备知识】Linux系统平均负载与top、uptime命令详解
系统平均负载是衡量Linux服务器性能的关键指标之一。通过使用 `top`和 `uptime`命令,可以实时监控系统的负载情况,帮助运维人员及时发现并解决潜在问题。理解这些工具的输出和意义是确保系统稳定运行的基础。希望本文对Linux系统平均负载及相关命令的详细解析能帮助您更好地进行系统运维和性能优化。
66 3
|
2月前
|
运维 监控 中间件
数据中心运维监控系统产品价值与优势
华汇数据运维监控系统面向IT基础架构及IT支撑平台的监控和运维管理,包含监测、分析、展现和告警。监控范围涵盖了网络设备、主机系统、数据库、中间件和应用软件等。
69 4
|
3月前
|
人工智能 API 决策智能
swarm Agent框架入门指南:构建与编排多智能体系统的利器 | AI应用开发
Swarm是OpenAI在2024年10月12日宣布开源的一个实验性质的多智能体编排框架。其核心目标是让智能体之间的协调和执行变得更轻量级、更容易控制和测试。Swarm框架的主要特性包括轻量化、易于使用和高度可定制性,非常适合处理大量独立的功能和指令。【10月更文挑战第15天】
460 6
|
3月前
|
运维 监控 安全
高效运维管理:提升系统稳定性的策略与实践
【10月更文挑战第13天】 本文探讨了高效运维管理的关键策略和实践,旨在帮助运维团队提升系统的稳定性。通过分析常见问题,提出具体的解决方案,包括监控与告警、自动化工具的应用、故障排查与恢复、性能优化以及安全防护等方面。通过这些策略和实践,可以帮助企业构建一个稳定、可靠且高效的IT系统。
101 1
|
2月前
|
运维 监控 网络协议
自动化运维的魔法——打造高效、可靠的系统
【10月更文挑战第32天】在数字化时代的浪潮下,运维不再是简单的硬件维护和故障排除。它已经演变成一场关乎效率、稳定性和创新的技术革命。自动化运维,作为这场革命的核心,正引领着企业走向更加智能和高效的未来。本文将带你探索自动化运维的世界,揭示其背后的原理和实践,让你领略到自动化带来的无限可能。
31 0
|
6月前
|
运维 关系型数据库 MySQL
掌握taskset:优化你的Linux进程,提升系统性能
在多核处理器成为现代计算标准的今天,运维人员和性能调优人员面临着如何有效利用这些处理能力的挑战。优化进程运行的位置不仅可以提高性能,还能更好地管理和分配系统资源。 其中,taskset命令是一个强大的工具,它允许管理员将进程绑定到特定的CPU核心,减少上下文切换的开销,从而提升整体效率。
掌握taskset:优化你的Linux进程,提升系统性能

推荐镜像

更多