第⼆章 可靠性⼯程世界中得监控

简介: 第⼆章 可靠性⼯程世界中得监控

在将可靠性⼯程概念应⽤于监控数据库基础架构的过程中,不断改进并重新审视指标和⽬标⾮常重要。

在第⼀次定义⼀些SLI和SLO之后,并不意味着⼀成不变。

随着业务的发展,你将对客户体验有更深⼊的了解,这将推动SLI和SLO的改进。

在选择指标并为其分配⽬标时,要意识到需要始终专注于表达客户体验。

此外,不要将所有精⼒都集中在显示事故发⽣的指标上,⽽是应花⼀些时间来监控可以帮助预防事故的事情。

这都是为保护客户体验的主动⾏为。

建议在三个关键⽅⾯预先设定⽬标:延迟、可⽤性和错误。这三个⽅⾯可以提供⼀个很好的信号,表明客户是否满意。

除此之外,还要确保在连接数增⻓、磁盘空间使⽤率增⻓、磁盘I/O使⽤率和延迟⽅⾯进⾏主动监控。

希望本章能够帮助你了解如何在公司规模不断扩⼤的情况下,成功地将可靠性⼯程应⽤于监控MySQL。

相关文章
|
2月前
|
消息中间件 缓存 监控
在FaaS中,如何设计无状态的函数来确保数据处理的一致性?
在FaaS中,如何设计无状态的函数来确保数据处理的一致性?
|
4月前
|
负载均衡 NoSQL 调度
异步任务处理系统问题之任务执行子系统实现任务的可靠执行的问题如何解决
异步任务处理系统问题之任务执行子系统实现任务的可靠执行的问题如何解决
|
4月前
|
负载均衡
异步任务处理系统问题之任务去重机制工作的问题如何解决
异步任务处理系统问题之任务去重机制工作的问题如何解决
|
5月前
|
开发者
软件交付问题之有效地减少代码中的逻辑错误,如何解决
软件交付问题之有效地减少代码中的逻辑错误,如何解决
|
5月前
软件复用问题之度量组件的可靠性,如何解决
软件复用问题之度量组件的可靠性,如何解决
|
5月前
|
存储 缓存 NoSQL
架构设计篇问题之在数据割接过程中,多线程处理会导致数据错乱和重复问题如何解决
架构设计篇问题之在数据割接过程中,多线程处理会导致数据错乱和重复问题如何解决
|
5月前
|
SQL 监控
稳定性摸排问题之什么是状态机列表
稳定性摸排问题之什么是状态机列表
|
存储 监控 Cloud Native
剖析Linux网络包接收过程:掌握数据如何被捕获和分发的全过程(上)
剖析Linux网络包接收过程:掌握数据如何被捕获和分发的全过程
|
存储 监控 供应链
某企业存货验收入库内部控制流程设计
某企业存货验收入库内部控制流程设计
320 0
|
存储 网络协议 Linux
剖析Linux网络包接收过程:掌握数据如何被捕获和分发的全过程(下)
剖析Linux网络包接收过程:掌握数据如何被捕获和分发的全过程