如何解决服务雪崩?

简介: 一.什么是服务雪崩(1)分布式系统环境下,通常会有很多层的服务调用。由于网络原因或自身的原因,服务一般无法保证100%可用。如果一个服务出现了问题,调用这个服务就会出现线程阻塞的情况,此时若有大量的请求涌入,就会出现多条线程阻塞等待,进而导致服务瘫痪。(2)如下图,对于同步调用,当底层的库存服务不可用时,商品服务请求线程被阻塞,当有大批请求调用库存服务时,最终可能导致整个商品服务资源耗尽,无法继续对外提供服务。(3)由于服务与服务之间的依赖性,故障会传播,不可用沿请求调用链向上传递,会对整个微服务系统造成灾难性的严重后果,这就是服务故障的“雪崩效应”。

如何解决服务雪崩?



一.什么是服务雪崩


(1)分布式系统环境下,通常会有很多层的服务调用。由于网络原因或自身的原因,服务一般无法保证100%可用。如果一个服务出现了问题,调用这个服务就会出现线程阻塞的情况,此时若有大量的请求涌入,就会出现多条线程阻塞等待,进而导致服务瘫痪。


(2)如下图,对于同步调用,当底层的库存服务不可用时,商品服务请求线程被阻塞,当有大批请求调用库存服务时,最终可能导致整个商品服务资源耗尽,无法继续对外提供服务。


(3)由于服务与服务之间的依赖性,故障会传播,不可用沿请求调用链向上传递,会对整个微服务系统造成灾难性的严重后果,这就是服务故障的“雪崩效应”。


f999e03a12254c19a2eba562809fa807.png


二.容错方案


要防止雪崩的扩散,我们就要做好服务的容错:保护自己不被猪队友拖垮的一些措施。

常见的容错方案:隔离、超时、限流、熔断、降级


1.隔离


将系统按照一定的原则划分为若干个服务模块,各个模块之间相互独立,无强依赖。当有故障发生时,能将问题和影响隔离在某个模块内部,而不扩散风险,不涉及其他模块,不影响整体的系统服务。常见的隔离方式有:线程池隔离和信号量隔离。


c3665cd3c795456f9220977f07317575.png


2.超时


上游服务调用下游服务时,设置一个最大响应时间,如果超过这个时间,下游未作出响应,就断开请求,释放掉线程。


b8d625a1ad444a77a802dcf1944f650e.png


3.限流


限制系统的输入和输出流量以达到保护系统的目的。为了保证系统的稳定运行,一旦达到需要限制的阈值,就采取相应措施以完成限制流量的目的。


088319054319464b80420e048ece9aa5.png


4.熔断


当下游服务因访问压力过大而响应变慢或失败,上游服务为了保护系统整体的可用性,可以暂时切断对下游

服务的调用。这种牺牲局部,保护整体的措施就叫做熔断。


ad3be63970ec44b0be7d8c6b2887da08.png


5.降级


降级就是为服务提供了一个托底方案,一旦服务无法正常调用,就使用托底方案。


a93ed8fc262640778e7b10ebcf92e1a6.png


三.容错组件


1、Hystrix


Hystrix是由Netflix开源的一个延迟和容错组件,用于隔离访问远程系统、服务或者第三方库,防止级联失败,从而提升系统的可用性与容错性。


2、Resilience4J


Resilicence4J提供丰富的容错工具,轻量、简单、文档清晰,也是Spring Cloud官方推荐替代Hystrix的产品。不仅如此,Resilicence4j还原生支持Spring Boot 1.x/2.x,而且监控也支持和prometheus等多款主流产品进行整合。


3、Sentinel


Sentinel 是阿里巴巴开源的一款断路器实现,在阿里内部已经被大规模采用,非常稳定。


四.Sentinel介绍


1、什么是Sentinel


Sentinel (分布式系统的流量防卫兵) 是阿里开源的一套用于服务容错的综合性解决方案。它以流量为切入点,从流量控制、熔断降级、系统负载保护等多个维度来保护服务的稳定性。


2、Sentinel 的特征


(1)丰富的应用场景:Sentinel 承接了阿里巴巴近 10 年的双十一大促流量的核心场景,例如秒杀、消息削峰填谷、集群流量控制、实时熔断下游不可用应用等。


(2)完备的实时监控:Sentinel 提供了实时的监控功能。通过控制台可以看到接入应用的单台机器秒级数据,甚至 500 台以下规模的集群的汇总运行情况。


(3)广泛的开源生态:Sentinel 提供开箱即用的与其它开源框架/库的整合模块,例如与 SpringCloud、Dubbo、gRPC 的整合。只需要引入相应的依赖并进行简单的配置即可快速地接入Sentinel。


(4)完善的扩展点:Sentinel 提供简单易用、完善的扩展接口。您可以通过实现扩展接口来快速地定制逻辑。例如定制规则管理、适配动态数据源等。


3、Sentinel 的组成


(1)核心库(Java 客户端):不依赖任何框架/库,能够运行于所有 Java 运行时环境,同时对 Dubbo /Spring Cloud 等框架也有较好的支持。


(2)控制台(Dashboard):基于 Spring Boot 开发,打包后可以直接运行,不需要额外的 Tomcat 等应用容器。


五.Sentinel控制台


Sentinel 提供一个轻量级的控制台, 它提供机器发现、单机资源实时监控以及规则管理等功能。


1、下载和安装


①下载地址:https://github.com/alibaba/Sentinel/releases

②下载版本:sentinel-dashboard-1.7.0.jar


2、启动控制台


控制台本身是一个SpringBoot项目,直接使用jar命令启动项目。在Sentinel目录下输入cmd,运行下面的命令:


e4be49bc16d24a1ca344f4df6163348a.png


//使用命令1(一般用这个就可以了)
java -jar sentinel-dashboard-1.7.0.jar
//或者命令2
java -Dserver.port=8888 -Dcsp.sentinel.dashboard.server=localhost:8080 -Dproject.name=sentinel-dashboard -jar sentinel-dashboard-1.7.0.jar


(1)访问:http://localhost:8080

(2)用户名密码:sentinel/sentinel


3.微服务集成Sentinel客户端


引入依赖(在服务消费者端引入依赖)


<!--服务容错-->
<dependency>
    <groupId>com.alibaba.cloud</groupId>
    <artifactId>spring-cloud-starter-alibaba-sentinel</artifactId>
</dependency>


4.微服务连接控制台


(1)微服务配置(在服务消费者端yml中添加以下配置)


spring:
  cloud:
    sentinel:
      transport:
        port: 8081 #跟控制台交流的端口,随意指定一个未使用的端口即可
        dashboard: localhost:8080 # 指定控制台服务的地址


(2)控制台运行原理


①Sentinel的控制台是一个SpringBoot编写的程序。我们需要将我们的微服务程序注册到控制台上,即在微服务中指定控制台的地址(localhost:8080)


②并且还要开启一个跟控制台传递数据的端口(8081),控制台也可以通过此端口调用微服务中的监控程序获取微服务的各种信息。

运行项目以后就可以正常使用sentinel了。


目录
相关文章
|
缓存 监控 NoSQL
Redis - 在电商购物车场景下的实战分析
Redis - 在电商购物车场景下的实战分析
1209 0
|
监控 负载均衡 Java
5 大 SpringCloud 核心组件详解,8 张图彻底弄懂
本文图文详解 Spring Cloud 的五大核心组件,帮助深入理解和掌握微服务架构。关注【mikechen的互联网架构】,10年+BAT架构经验倾囊相授。
5 大 SpringCloud 核心组件详解,8 张图彻底弄懂
|
算法 Java Sentinel
限流算法(计数器、滑动时间窗口、漏斗、令牌)原理以及代码实现
> 本文会对这4个限流算法进行详细说明,并输出实现限流算法的代码示例。 > 代码是按照自己的理解写的,很简单的实现了功能,还请大佬们多多交流找bug。
2866 0
|
存储 监控 druid
Druid、ClickHouse、Doris、StarRocks 的区别与分析
本文对比了 Druid、ClickHouse、Doris 和 StarRocks 四款大数据分析引擎。它们均为 OLAP 引擎,采用列式存储和分布式架构,适用于海量数据分析。Druid 擅长实时分析与高并发查询;ClickHouse 以超高性能著称,适合复杂查询;Doris 提供易用的 SQL 接口,性能均衡;StarRocks 则以其极速查询和实时更新能力脱颖而出。各引擎在数据模型、查询性能、数据更新和存储方面存在差异,适用于不同的业务场景。选择时需根据具体需求综合考虑。
7650 20
|
传感器 数据采集 搜索推荐
重新定义未来:可穿戴设备的创新设计与制造
重新定义未来:可穿戴设备的创新设计与制造
511 9
|
消息中间件 存储 运维
RocketMQ与Kafka深度对比:特性与适用场景解析
RocketMQ与Kafka深度对比:特性与适用场景解析
|
存储 数据采集 数据库
Python爬虫实战:股票分时数据抓取与存储
Python爬虫实战:股票分时数据抓取与存储
|
消息中间件 编解码 Docker
【Docker项目实战】Docker部署RabbitMQ消息中间件
【10月更文挑战第8天】Docker部署RabbitMQ消息中间件
945 2
【Docker项目实战】Docker部署RabbitMQ消息中间件
|
SQL 物联网 数据处理
NL2SQL进阶系列(1):DB-GPT-Hub、SQLcoder、Text2SQL开源应用实践详解
NL2SQL进阶系列(1):DB-GPT-Hub、SQLcoder、Text2SQL开源应用实践详解
NL2SQL进阶系列(1):DB-GPT-Hub、SQLcoder、Text2SQL开源应用实践详解
|
XML 缓存 Java
Spring Boot 优雅实现降级功能:Hystrix 与 Resilience4j 的实践
【6月更文挑战第19天】在分布式系统中,服务降级是一种重要的容错机制。当某个服务不可用或响应慢时,降级机制可以保证系统的整体稳定性。本文将详细介绍如何在 Spring Boot 中使用 Hystrix 和 Resilience4j 实现降级功能。
1119 7