分布式统一监控系统架构图与设计思路

简介: 一、问题解答二、分布式统一系统三、统一监控系统架构图四、设计思路

分布式统一监控系统架构图与设计思路

 

目录:

一、问题解答

二、分布式统一系统

三、统一监控系统架构图

四、设计思路

 

一、问题解答

1.Gangliazbase进行对比?

1)、它们的机制上区别不大。

2)、监控的服务器应用不多就使用zbase,部署来说相对简单,当服务器多,zbase扩展比较麻烦,性能较低。

3)、如果服务器低于一千台可以选择使用zbase,若服务器超过一千台,推荐使用centreon+ganglia,他的扩展性高,但是部署步骤很麻烦。

 

2.两万八千台服务器使用zbase性能如何?

通过测试一千台服务器会报警,报警有延时,并且延时非常大,且负载很高,对一个监控来说,报警的实时性要求很高,若延时很高就失去了报警的意义。

 

3.ganglia的好处

Ganglia的好处在于前端更新能在10秒之内把更新返回到服务器,可以及时处理问题,处理问题的时间间隔非常短,若服务器很多,可以通过多种方式,不一定要采用那个软件,若一个机制非常成熟的话,他会集成多个开源软件。

 

4.ganglia数据汇总

Ganglia天生可以实现数据汇总

image.png

 

图示指标不需要添加任何东西,但在zbase中需要添加第三方工具来实现。所以说每个软件都有它的优缺点。具体怎么去选择使用,还是要综合的去选择。去用它的优点然后屏蔽它的缺点就可以了。

 

5.关于报警

原来我们是有短信网关,或者是报警接口,但是事实上来说,短信报警对运维人员意义不大,移动端的发展可以使用网易邮箱实时,可以看到更加详细的信息,完全可以抛弃短信报警,当然,确实想用短信报警也没问题,支持多个手机运营商,注册好会发邮件,139发的邮件多会有延迟,但一封两封不会有延迟。变相实现短信报警非常方便。

 

6.预发布环境和真实环境的差距?

预发布环境和真实环境没有实质性差别,而预发布环境没有线上业务,部署结构上和真实环境一模一样的。

 

 

二、分布式统一系统

监控数据和报表通过web方式展示出来,将NagiosGangliaweb进行集合,并作二次开发,通过一个统一的界面展示监控状态和报表信息。

 

 

三、统一监控系统架构图

image.png

 

 

四、设计思路

1.Cluster1-n均为一个分布式集群,也可以认为是一个机房数据中心。每个数据中心的node server都运行一个gmond守护进程,进行数据收集,将收集到的数据汇总到ganglia proxy主机,ganglia proxy主机上运行着gmetad守护进程。


同时ganglia proxynode server都加载通过c或者python编写的ganglia插件,扩展ganglia监控功能(Python 编译升级方式:用源码方法升级)。

 

2.managerserver是一个管理主机,主要用于收集从各个机房数据中心的监控数据,通过数据抽取模块将nagiosganglia整合到一起,考虑到数据的安全性,manager server建议做一个备机,主机和备机一起工作时,进行数据收集,主机故障时,自动切换到备机,保证管理主机可用。

 

3.监控数据和报表通过web方式展示出来,将NagiosGangliaweb进行整合,并做二次开发,通过一个统一的界面展示监控状态和报表信息。

 

优缺点:

服务器如果1000台以内就采用zbase,超过1000台报警就会有延迟

Ganglia系统可以自动实现数据汇总。

相关文章
|
19天前
|
存储 Prometheus Cloud Native
分布式系统架构6:链路追踪
本文深入探讨了分布式系统中的链路追踪理论,涵盖追踪与跨度的概念、追踪系统的模块划分及数据收集的三种方式。链路追踪旨在解决复杂分布式系统中请求流转路径不清晰的问题,帮助快速定位故障和性能瓶颈。文中介绍了基于日志、服务探针和边车代理的数据收集方法,并简述了OpenTracing、OpenCensus和OpenTelemetry等链路追踪协议的发展历程及其特点。通过理解这些概念,可以更好地掌握开源链路追踪框架的使用。
77 41
|
4月前
|
安全 应用服务中间件 API
微服务分布式系统架构之zookeeper与dubbo-2
微服务分布式系统架构之zookeeper与dubbo-2
|
4月前
|
负载均衡 Java 应用服务中间件
微服务分布式系统架构之zookeeper与dubbor-1
微服务分布式系统架构之zookeeper与dubbor-1
|
3天前
|
存储 缓存 安全
分布式系统架构7:本地缓存
这是小卷关于分布式系统架构学习的第10篇文章,主要介绍本地缓存的基础理论。文章分析了引入缓存的利弊,解释了缓存对CPU和I/O压力的缓解作用,并讨论了缓存的吞吐量、命中率、淘汰策略等属性。同时,对比了几种常见的本地缓存工具(如ConcurrentHashMap、Ehcache、Guava Cache和Caffeine),详细介绍了它们的访问控制、淘汰策略及扩展功能。
22 6
|
6天前
|
存储 关系型数据库 分布式数据库
[PolarDB实操课] 01.PolarDB分布式版架构介绍
《PolarDB实操课》之“PolarDB分布式版架构介绍”由阿里云架构师王江颖主讲。课程涵盖PolarDB-X的分布式架构、典型业务场景(如实时交易、海量数据存储等)、分布式焦点问题(如业务连续性、一致性保障等)及技术架构详解。PolarDB-X基于Share-Nothing架构,支持HTAP能力,具备高可用性和容错性,适用于多种分布式改造和迁移场景。课程链接:[https://developer.aliyun.com/live/253957](https://developer.aliyun.com/live/253957)。更多内容可访问阿里云培训中心。
[PolarDB实操课] 01.PolarDB分布式版架构介绍
|
4月前
|
存储 JSON 数据库
Elasticsearch 分布式架构解析
【9月更文第2天】Elasticsearch 是一个分布式的搜索和分析引擎,以其高可扩展性和实时性著称。它基于 Lucene 开发,但提供了更高级别的抽象,使得开发者能够轻松地构建复杂的搜索应用。本文将深入探讨 Elasticsearch 的分布式存储和检索机制,解释其背后的原理及其优势。
353 5
|
11天前
|
消息中间件 监控 小程序
电竞陪玩系统架构优化设计,陪玩app如何提升系统稳定性,陪玩小程序平台的测试与监控
电竞陪玩系统架构涵盖前端(React/Vue)、后端(Spring Boot/php)、数据库(MySQL/MongoDB)、实时通信(WebSocket)及其他组件(Redis、RabbitMQ、Nginx)。通过模块化设计、微服务架构和云计算技术优化,提升系统性能与可靠性。同时,加强全面测试、实时监控及故障管理,确保系统稳定运行。
|
29天前
|
设计模式 存储 算法
分布式系统架构5:限流设计模式
本文是小卷关于分布式系统架构学习的第5篇,重点介绍限流器及4种常见的限流设计模式:流量计数器、滑动窗口、漏桶和令牌桶。限流旨在保护系统免受超额流量冲击,确保资源合理分配。流量计数器简单但存在边界问题;滑动窗口更精细地控制流量;漏桶平滑流量但配置复杂;令牌桶允许突发流量。此外,还简要介绍了分布式限流的概念及实现方式,强调了限流的代价与收益权衡。
76 11
|
1月前
|
设计模式 监控 Java
分布式系统架构4:容错设计模式
这是小卷对分布式系统架构学习的第4篇文章,重点介绍了三种常见的容错设计模式:断路器模式、舱壁隔离模式和重试模式。断路器模式防止服务故障蔓延,舱壁隔离模式通过资源隔离避免全局影响,重试模式提升短期故障下的调用成功率。文章还对比了这些模式的优缺点及适用场景,并解释了服务熔断与服务降级的区别。尽管技术文章阅读量不高,但小卷坚持每日更新以促进个人成长。
53 11
|
1月前
|
消息中间件 存储 安全
分布式系统架构3:服务容错
分布式系统因其复杂性,故障几乎是必然的。那么如何让系统在不可避免的故障中依然保持稳定?本文详细介绍了分布式架构中7种核心的服务容错策略,包括故障转移、快速失败、安全失败等,以及它们在实际业务场景中的应用。无论是支付场景的快速失败,还是日志采集的安全失败,每种策略都有自己的适用领域和优缺点。此外,文章还为技术面试提供了解题思路,助你在关键时刻脱颖而出。掌握这些策略,不仅能提升系统健壮性,还能让你的技术栈更上一层楼!快来深入学习,走向架构师之路吧!
67 11

热门文章

最新文章