分布式统一监控系统架构图与设计思路| 学习笔记

简介: 快速学习分布式统一监控系统架构图与设计思路。

开发者学堂课程【企业运维监控平台架构设计与实现分布式统一监控系统架构图与设计思路】学习笔记,与课程紧密联系,让用户快速学习知识。

课程地址:https://developer.aliyun.com/learning/course/384/detail/4826


分布式统一监控系统架构图与设计思路

 

目录:

一、问题解答

二、分布式统一系统

三、统一监控系统架构图

四、设计思路


一、问题解答

1.Ganglia与zbase进行对比?

1)、它们的机制上区别不大.

2)、监控的服务器应用不多就使用 zbase ,部署来说相对简单,当服务器多,zbase 扩展比较麻烦,性能较低。

3)、如果服务器低于一千台可以选择使用 zbase ,若服务器超过一千台,推荐使用 centreon+ganglia ,他的扩展性高,但是部署步骤很麻烦。

2.两万八千台服务器使用zbase性能如何?

通过测试一千台服务器会报警,报警有延时,并且延时非常大,且负载很高,对一个监控来说,报警的实时性要求很高,若延时很高就失去了报警的意义

3.ganglia的好处

Ganglia 的好处在于前端更新能在10秒之内把更新返回到服务器,可以及时处理问题,处理问题的时间间隔非常短,若服务器很多,可以通过多种方式,不一定要采用那个软件,若一个机制非常成熟的话,他会集成多个开源软件。

4.ganglia数据汇总

Ganglia 天生可以实现数据汇总

image.png

图示指标不需要添加任何东西,但在 zbase 中需要添加第三方工具来实现。所以说每个软件都有它的优缺点。具体怎么去选择使用,还是要综合的去选择。去用它的优点然后屏蔽它的缺点就可以了。

5.关于报警

原来我们是有短信网关,或者是报警接口,但是事实上来说,短信报警对运维人员意义不大,移动端的发展可以使用网易邮箱实时,可以看到更加详细的信息,完全可以抛弃短信报警,当然,确实想用短信报警也没问题,支持多个手机运营商,注册好会发邮件,139发的邮件多会有延迟,但一封两封不会有延迟。变相实现短信报警非常方便。

6.预发布环境和真实环境的差距?

预发布环境和真实环境没有实质性差别,而预发布环境没有线上业务,部署结构上和真实环境一模一样的


二、分布式统一系统

监控数据和报表通过 web 方式展示出来,将 Nagios 和 Ganglia 的 web 进行集合,并作二次开发,通过一个统一的界面展示监控状态和报表信息

 

三、统一监控系统架构图

image.png


四、设计思路

1.Cluster1-n 均为一个分布式集群,也可以认为是一个机房数据中心。每个数据中心的 node server 都运行一个 gmond 守护进程,进行数据收集,将收集到的数据汇总到 ganglia proxy 主机,ganglia proxy 主机上运行着 gmetad 守护进程。

同时 ganglia proxy 和 node server 都加载通过 c 或者 python 编写的 ganglia 插件,扩展 ganglia 监控功能(Python 编译升级方式:用源码方法升级)

2.managerserver 是一个管理主机,主要用于收集从各个机房数据中心的监控数据,通过数据抽取模块将 nagios 和 ganglia 整合到一起,考虑到数据的安全性,manager server 建议做一个备机,主机和备机一起工作时,进行数据收集,主机故障时,自动切换到备机,保证管理主机可用

3.监控数据和报表通过 web 方式展示出来,将 Nagios 和 Ganglia 的 web 进行整合,并做二次开发,通过一个统一的界面展示监控状态和报表信息

优缺点:

服务器如果1000台以内就采用 zbase,超过1000台报警就会有延迟

Ganglia 系统可以自动实现数据汇总

相关文章
|
2月前
|
安全 应用服务中间件 API
微服务分布式系统架构之zookeeper与dubbo-2
微服务分布式系统架构之zookeeper与dubbo-2
|
2月前
|
负载均衡 Java 应用服务中间件
微服务分布式系统架构之zookeeper与dubbor-1
微服务分布式系统架构之zookeeper与dubbor-1
|
2月前
|
存储 JSON 数据库
Elasticsearch 分布式架构解析
【9月更文第2天】Elasticsearch 是一个分布式的搜索和分析引擎,以其高可扩展性和实时性著称。它基于 Lucene 开发,但提供了更高级别的抽象,使得开发者能够轻松地构建复杂的搜索应用。本文将深入探讨 Elasticsearch 的分布式存储和检索机制,解释其背后的原理及其优势。
177 5
|
3月前
|
消息中间件 SQL 监控
Serverless 应用的监控与调试问题之BMQ的架构是怎么支持流批一体的
Serverless 应用的监控与调试问题之BMQ的架构是怎么支持流批一体的
|
14天前
|
运维 供应链 安全
SD-WAN分布式组网:构建高效、灵活的企业网络架构
本文介绍了SD-WAN(软件定义广域网)在企业分布式组网中的应用,强调其智能化流量管理、简化的网络部署、弹性扩展能力和增强的安全性等核心优势,以及在跨国企业、多云环境、零售连锁和制造业中的典型应用场景。通过合理设计网络架构、选择合适的网络连接类型、优化应用流量优先级和定期评估网络性能等最佳实践,SD-WAN助力企业实现高效、稳定的业务连接,加速数字化转型。
SD-WAN分布式组网:构建高效、灵活的企业网络架构
|
19天前
|
消息中间件 关系型数据库 Java
‘分布式事务‘ 圣经:从入门到精通,架构师尼恩最新、最全详解 (50+图文4万字全面总结 )
本文 是 基于尼恩之前写的一篇 分布式事务的文章 升级而来 , 尼恩之前写的 分布式事务的文章, 在全网阅读量 100万次以上 , 被很多培训机构 作为 顶级教程。 此文修改了 老版本的 一个大bug , 大家不要再看老版本啦。
|
3月前
|
弹性计算 Cloud Native Windows
核心系统转型问题之核心系统需要转型到云原生分布式架构的原因如何解决
核心系统转型问题之核心系统需要转型到云原生分布式架构的原因如何解决
|
3月前
|
监控 Java 应用服务中间件
分布式链路监控系统问题之Eagleeye的traceId设计的问题如何解决
分布式链路监控系统问题之Eagleeye的traceId设计的问题如何解决
|
3月前
|
存储 监控 Cloud Native
Serverless 应用的监控与调试问题之Flink流批一体在架构层面有什么演进
Serverless 应用的监控与调试问题之Flink流批一体在架构层面有什么演进
|
3月前
|
监控 API 开发者
分布式链路监控系统问题之ASM的开发体验被认为是噩梦般的问题如何解决
分布式链路监控系统问题之ASM的开发体验被认为是噩梦般的问题如何解决

热门文章

最新文章