在将可靠性⼯程概念应⽤于监控数据库基础架构的过程中,不断改进并重新审视指标和⽬标⾮常重要。
在第⼀次定义⼀些SLI和SLO之后,并不意味着⼀成不变。
随着业务的发展,你将对客户体验有更深⼊的了解,这将推动SLI和SLO的改进。
在选择指标并为其分配⽬标时,要意识到需要始终专注于表达客户体验。
此外,不要将所有精⼒都集中在显示事故发⽣的指标上,⽽是应花⼀些时间来监控可以帮助预防事故的事情。
这都是为保护客户体验的主动⾏为。
建议在三个关键⽅⾯预先设定⽬标:延迟、可⽤性和错误。这三个⽅⾯可以提供⼀个很好的信号,表明客户是否满意。
除此之外,还要确保在连接数增⻓、磁盘空间使⽤率增⻓、磁盘I/O使⽤率和延迟⽅⾯进⾏主动监控。
希望本章能够帮助你了解如何在公司规模不断扩⼤的情况下,成功地将可靠性⼯程应⽤于监控MySQL。