第⼆章 可靠性⼯程世界中得监控

简介: 第⼆章 可靠性⼯程世界中得监控

在将可靠性⼯程概念应⽤于监控数据库基础架构的过程中,不断改进并重新审视指标和⽬标⾮常重要。

在第⼀次定义⼀些SLI和SLO之后,并不意味着⼀成不变。

随着业务的发展,你将对客户体验有更深⼊的了解,这将推动SLI和SLO的改进。

在选择指标并为其分配⽬标时,要意识到需要始终专注于表达客户体验。

此外,不要将所有精⼒都集中在显示事故发⽣的指标上,⽽是应花⼀些时间来监控可以帮助预防事故的事情。

这都是为保护客户体验的主动⾏为。

建议在三个关键⽅⾯预先设定⽬标:延迟、可⽤性和错误。这三个⽅⾯可以提供⼀个很好的信号,表明客户是否满意。

除此之外,还要确保在连接数增⻓、磁盘空间使⽤率增⻓、磁盘I/O使⽤率和延迟⽅⾯进⾏主动监控。

希望本章能够帮助你了解如何在公司规模不断扩⼤的情况下,成功地将可靠性⼯程应⽤于监控MySQL。

相关文章
|
1月前
|
存储 Web App开发 运维
原来10张图就可以搞懂分布式链路追踪系统原理
原来10张图就可以搞懂分布式链路追踪系统原理
|
8月前
|
存储 监控 数据可视化
01.崩溃捕获设计实践方案
01.崩溃捕获设计实践方案
131 3
|
11月前
|
安全 Java API
了解程序运行逻辑的必要性及应用和硬件的关系
了解程序运行逻辑的必要性及应用和硬件的关系
61 0
|
11月前
|
存储 分布式计算 安全
「分布式架构」最终一致性:暗示的切换队列
「分布式架构」最终一致性:暗示的切换队列
|
11月前
|
程序员 C++ 开发者
C++异常和错误处理机制:如何使您的程序更加稳定和可靠
在C++编程中,异常处理和错误处理机制是非常重要的。它们可以帮助程序员有效地处理运行时错误和异常情况。本文将介绍C++中的异常处理和错误处理机制。
88 0
|
算法 调度
【操作系统篇】第五篇——调度(概念,层次,调度时机,切换与过程,方式,评价指标)
【操作系统篇】第五篇——调度(概念,层次,调度时机,切换与过程,方式,评价指标)
【操作系统篇】第五篇——调度(概念,层次,调度时机,切换与过程,方式,评价指标)
|
监控 安全 关系型数据库
稳定性之故障应急处理流程
尽管可以通过稳定性体系建设,来避免出现生产系统故障。但是仍然无法彻底避免一点风险都不会产生,当稳定性风险产生后,怎么快速协调组织,缩短故障时长,科学的流程呢?
稳定性之故障应急处理流程
|
存储 缓存 监控
近期业务大量突增微服务性能优化总结-2.开发日志输出异常堆栈的过滤插件
近期业务大量突增微服务性能优化总结-2.开发日志输出异常堆栈的过滤插件
近期业务大量突增微服务性能优化总结-2.开发日志输出异常堆栈的过滤插件
|
存储 运维 大数据
9种常用的软件容错处理方式
本文重点讨论软件容错的问题。
1370 0
9种常用的软件容错处理方式
|
消息中间件 Prometheus 监控
监控、链路追踪、日志的区别,傻傻分不清?
对于一个系统来说,监控、链路追踪、日志的这三者需求都是必然存在的,而有的时候我们会搞不清楚这三者相互之间是什么关系。 我之前在做系统设计的时候也考虑过,是不是有必要引入那么多组件,毕竟如果这三者完全分开每一个一项的话,就有三个组件了(事实上就是:Prometheus+Grafana、Jaeger、ELK)。
541 0

相关实验场景

更多