架构设计70-质量管理10-微服务故障

本文涉及的产品
服务治理 MSE Sentinel/OpenSergo,Agent数量 不受限
云原生网关 MSE Higress,422元/月
注册配置 MSE Nacos/ZooKeeper,118元/月
简介: 架构设计70-质量管理10-微服务故障

架构设计系列文章,请参见连接。

故障为什么发生?

从单体服务发展到微服务之后就会发现故障是不可避免的了。从分布式计算的故障问题也会相应的加入到系统中。所以从单体服务到微服务之后就变成了不可避免的事情。具体可以从以下几个方面说明。

  • 故障无处不在

netflix微服务环境

《微服务设计》-11.规模化微服务
从统计学上来看,规模化之后故障将成为必然事件。

《生产微服务》-18.更多失效的可能性
大型分布式微服务系统包含大量持续变化的小型服务。对于这种复杂系统,我们要接受系统里的组建必然会失效的事实,而且它们经常的失效。

上面是两本书中说明的故障不可避免的问题。另外一个方面也会有软件的规模化的问题。从敏捷的角度看敏捷规模化成为问题才出现了SAFe,Less这种规模化问题解决方案。那么微服务规模化也是有类似的问题,规模化之后和之前几个服务的情况有质的区别。

  • 微服务特点

微服务特点

而本质上,单体应用到微服务应用的转型就是应用的内部的高风险依赖转化为外部的低风险依赖的过程。是内部复杂度向外部复杂度的转换。因此,微服务架构改造所花费的成本大部分都在处理服务间的通信。

  • 墨菲定律

墨菲定律

事情往往会向你所想到的不好的方向发展,只要有这个可能性。即:你越害怕的事情越可能发生。

故障怎么发生?

从上一节看我们没有办法从事前确定故障并解决故障,那怎么在事中解决问题。就变成必须要做的事情。
故障过程

  • 惊群效应

连锁故障是由于正反馈循环(positive feedback)导致的不断扩大规模的故障。连锁故障可能由于整个系统的一小部分出现故障而引发,进而导致系统其他部分也出现故障。例如,某个服务的一个实例由于过载出现故障,导致其他实例负载升高,从而导致这些实例像多米诺骨牌一样一个以全部出现故障。

  • 同质化问题

之前看过一种理论,同一个磁盘阵列中不能购买同一品牌,同一批次的磁盘组成磁盘阵列。原因是:从理论上来说,同一批次,又是同一使用环境,一起出问题的概率总要比不同批次的概率大点。
也就是在相似的初始条件下,又进行了相似的器件损耗的。造成同样问题的可能性也比较高。将这个问题推广到我们的软件系统中,会发现问题更加严重。因为我们的软件系统中服务都是同一个服务多实例部署的,这样就会发现服务不是相似的那么简单的了,服务是一样的。那么推导下去多实例中每一个服务对于同一件事情的处理方式,响应方式都是一样的。那么一个服务遇到一个错误,这类错误就会发生在所有的实例上。

  • 资源共享

现在都在使用微服务进行服务的业务的管理与调度工作。对于服务来说服务的共享资源就成为不同业务抢占的资源,例如CPU资源,内存资源,数据库连接资源,线程资源,文件描述符资源等等。简单的说就是如果一个业务处理时间较长或卡住那么整体业务就可能被卡住,导致系统假死问题。

  • 分布式系统故障

http://www.xumenger.com/the-eight-fallacies-of-distributed-computing-20180817/
分布式系统相关挑战:https://aws.amazon.com/cn/builders-library/challenges-with-distributed-systems/

故障的定位过程

SRE俗语

不能将碰运气当成战略。

使用grafana+prometheus+alertmanager做可视化。使用apm这样的工具去做详细故障定位。

故障解决办法

故障注定会发生,那该怎么应对与解决?对于业界已经有了很多线程的解决方案。

优雅的服务降级 Graceful Service Degradation
变更管理 Change management
自愈 Self-healing
故障切换缓存 Failover Caching
重试机制 Retry Logic
限流与降级 Rate Limiters and Load Shedders
快速且独立地失败 Fail Fast and Independently
舱壁 Bulkheads
断路器 Circuit Breakers

但对于作者个人来说下面的这些方法也可以有效的解决故障问题。

  • 间接依赖

向稳定依赖:通过中间件的方式拆分依赖。例如使用MQ通信,使用Redis作为黑板模式中心仓库。

  • 故障隔离

讲故障隔离在笼子中。减少故障的传播过程。使用FF4j这种特性开关解决问题

  • 减少共享

Hystrix线程隔离技术解析-线程池,数据库连接隔离。

  • 故障注入

混沌工程

参考

『Microservices & Nameko』Python 微服务实践

目录
相关文章
|
26天前
|
弹性计算 API 持续交付
后端服务架构的微服务化转型
本文旨在探讨后端服务从单体架构向微服务架构转型的过程,分析微服务架构的优势和面临的挑战。文章首先介绍单体架构的局限性,然后详细阐述微服务架构的核心概念及其在现代软件开发中的应用。通过对比两种架构,指出微服务化转型的必要性和实施策略。最后,讨论了微服务架构实施过程中可能遇到的问题及解决方案。
|
2月前
|
Cloud Native Devops 云计算
云计算的未来:云原生架构与微服务的革命####
【10月更文挑战第21天】 随着企业数字化转型的加速,云原生技术正迅速成为IT行业的新宠。本文深入探讨了云原生架构的核心理念、关键技术如容器化和微服务的优势,以及如何通过这些技术实现高效、灵活且可扩展的现代应用开发。我们将揭示云原生如何重塑软件开发流程,提升业务敏捷性,并探索其对企业IT架构的深远影响。 ####
44 3
|
2月前
|
Cloud Native 安全 数据安全/隐私保护
云原生架构下的微服务治理与挑战####
随着云计算技术的飞速发展,云原生架构以其高效、灵活、可扩展的特性成为现代企业IT架构的首选。本文聚焦于云原生环境下的微服务治理问题,探讨其在促进业务敏捷性的同时所面临的挑战及应对策略。通过分析微服务拆分、服务间通信、故障隔离与恢复等关键环节,本文旨在为读者提供一个关于如何在云原生环境中有效实施微服务治理的全面视角,助力企业在数字化转型的道路上稳健前行。 ####
|
26天前
|
Java 开发者 微服务
从单体到微服务:如何借助 Spring Cloud 实现架构转型
**Spring Cloud** 是一套基于 Spring 框架的**微服务架构解决方案**,它提供了一系列的工具和组件,帮助开发者快速构建分布式系统,尤其是微服务架构。
149 68
从单体到微服务:如何借助 Spring Cloud 实现架构转型
|
28天前
|
设计模式 负载均衡 监控
探索微服务架构下的API网关设计
在微服务的大潮中,API网关如同一座桥梁,连接着服务的提供者与消费者。本文将深入探讨API网关的核心功能、设计原则及实现策略,旨在为读者揭示如何构建一个高效、可靠的API网关。通过分析API网关在微服务架构中的作用和挑战,我们将了解到,一个优秀的API网关不仅要处理服务路由、负载均衡、认证授权等基础问题,还需考虑如何提升系统的可扩展性、安全性和可维护性。文章最后将提供实用的代码示例,帮助读者更好地理解和应用API网关的设计概念。
62 8
|
2月前
|
Dubbo Java 应用服务中间件
服务架构的演进:从单体到微服务的探索之旅
随着企业业务的不断拓展和复杂度的提升,对软件系统架构的要求也日益严苛。传统的架构模式在应对现代业务场景时逐渐暴露出诸多局限性,于是服务架构开启了持续演变之路。从单体架构的简易便捷,到分布式架构的模块化解耦,再到微服务架构的精细化管理,企业对技术的选择变得至关重要,尤其是 Spring Cloud 和 Dubbo 等微服务技术的对比和应用,直接影响着项目的成败。 本篇文章会从服务架构的演进开始分析,探索从单体项目到微服务项目的演变过程。然后也会对目前常见的微服务技术进行对比,找到目前市面上所常用的技术给大家进行讲解。
59 1
服务架构的演进:从单体到微服务的探索之旅
|
2月前
|
负载均衡 Java 持续交付
深入解析微服务架构中的服务发现与负载均衡
深入解析微服务架构中的服务发现与负载均衡
74 7
|
2月前
|
消息中间件 运维 Kubernetes
后端架构演进:从单体到微服务####
本文将探讨后端架构的演变过程,重点分析从传统的单体架构向现代微服务架构的转变。通过实际案例和理论解析,揭示这一转变背后的技术驱动力、挑战及最佳实践。文章还将讨论在采用微服务架构时需考虑的关键因素,包括服务划分、通信机制、数据管理以及部署策略,旨在为读者提供一个全面的架构转型视角。 ####
37 1
|
2月前
|
弹性计算 运维 开发者
后端架构优化:微服务与容器化的协同进化
在现代软件开发中,后端架构的优化是提高系统性能和可维护性的关键。本文探讨了微服务架构与容器化技术如何相辅相成,共同推动后端系统的高效运行。通过分析两者的优势和挑战,我们提出了一系列最佳实践策略,旨在帮助开发者构建更加灵活、可扩展的后端服务。
|
2月前
|
消息中间件 运维 Cloud Native
云原生架构下的微服务优化策略####
本文深入探讨了云原生环境下微服务架构的优化路径,针对服务拆分、通信效率、资源管理及自动化运维等核心环节提出了具体的优化策略。通过案例分析与最佳实践分享,旨在为开发者提供一套系统性的解决方案,以应对日益复杂的业务需求和快速变化的技术挑战,助力企业在云端实现更高效、更稳定的服务部署与运营。 ####