32.【学习心得】学习心得-熔断场景

简介: 【学习心得】学习心得-熔断场景

文档参考:书名:《从程序员到架构师:大数据量、缓存、高并发、微服务、多团队协同等核心场景实战》-王伟杰

image.png

前文如下:


23.【学习心得】学习心得-冷热分离概述

24.【学习心得】学习心得-如何分离冷热数据

25.【学习心得】学习心得-基于MySQL的分表分库

26.【学习心得】学习心得-读缓存

27.【学习心得】学习心得-如何更新redis缓存

28.【学习心得】学习心得-写缓存

29.【学习心得】学习心得-写缓存实现思路

30.【学习心得】学习心得-秒杀架构

31.【学习心得】学习心得-全链路日志


1. 业务场景:如何预防一个服务故障影响整个系统


在一个新零售架构系统中,有一个通用用户服务(很多页面都会使用),它包含两个接口。


1)第一个是用户状态接口,包含用户车辆所在位置。它在用户信息展示页面都会用到,比如客服系统中的用户信息页面。

2)第二个接口用于返回给用户一个可操作的权限列表,它包含一个通用权限,也包含用户定制权限,而且每次用户打开App时都会使用它。而这两个接口各自会碰到相应的问题,下面分别讨论。


1.1 第一个问题:请求慢


用户状态的接口、服务间的调用关系如图10-1所示。在Basic Data Service(基础数据服务)中,接口/currentCarLocation需要调用第三方系统的数据,但第三方响应速度很慢,而且有时还会发生故障,导致响应时间更长,接口经常出现超时报错


有一次,用户反馈App整体运行速度慢到无法接受的程度。运维人员通过后台监控查看了几个Thread Dump(线程转储),发现User API与Basic Data Service的线程请求数接近极限值,且所有的线程都在访问第三方接口(3rd Location API)。因为连接数满了,其他页面便不再受理User API的请求,最终导致App整体出现卡顿。


网络异常,图片无法展示
|


之前运维人员针对这个问题做过相关处理,考虑响应时间长,就把超时时间设置得很长,这样虽然超时报错少了,其他页面也保持正常,但是会导致客服后台查看用户信息的页面响应时间长。


1.2 第二个问题:流量洪峰缓存超时


户权限的接口、服务间的调用关系与上面类似,如图10-2所示。服务间的调用流程具体分为以下3个步骤。


网络异常,图片无法展示
|


1)APP访问User API。

2)User API访问Basic Data Service接口/commonAccesses。

3)Basic Data Service提供一个通用权限列表。因为权限列表对所有用户都一样,所以把它放在了Redis中,如果通用权限在Redis中找不到,再去数据库中查找。


所以把它放在了Redis中,如果通用权限在Redis中找不到,再去数据库中查找。


有一次,因为历史代码的原因,在流量高峰时Redis中的通用权限列表超时了,那一瞬间所有的线程都需要去数据库中读取数据,导致数据库的CPU使用率升到了100%。


数据库崩溃后,紧接着Basic Data Service也停了,因为所有的线程都堵塞了,获取不到数据库连接,导致Basic Data Service无法接收新的请求。User API因调用Basic Data Service的线程而出现了堵塞,以至于User API服务的所有线程都出现堵塞,即User API也停止工作,使得App上的所有操作都不能使用,后果比较严重。


2 覆盖场景


为了解决以上两个问题,需要引入一种技术,这种技术还要满足以下两个条件。


2.1 线程隔离


首先针对第一个问题进行举例说明。假设User API中每个服务配置的最大连接数是1000,每次API调用Basic Data Service的/currentCarLocation时速度会很慢,所以调用/currentCarLocation的线程就会很慢,一直不释放。


那么原因可能是,User API这个服务中的1000个连接线程全部都在调用/currentCarLocation这个服务。因此,希望控制/currentCarLocation的调用请求数,保证不超过50条,以此保证至少还有950条连接可用于处理常规请求。如果/currentCarLocation的调用请求数超过50条,就设计一些备用逻辑进行处理,比如在页面上给用户提示。



2.2 熔断


针对第二个问题,因为此时数据库并没有死锁,流量洪峰缓存超时只是因为压力太大,所以可以使Basic Data Service暂缓服务、不接收新的请求,这样Redis的数据会被补上,数据库的连接也会降下来,服务也就没问题了。


总结一下,这个技术应能实现以下两点需求。


1)发现近期某个接口的请求经常出现异常时,先不访问接口的服务。

2)发现某个接口的请求总是超时时,先判断接口的服务是否不堪重负,如果是,就先别访问它。


相关文章
|
SQL 机器学习/深度学习 存储
七大经典技术场景!Apache Flink 在多维领域应用的 40+ 实践案例
随着 Apache Flink 自身的发展,越来越多的企业选择 Apache Flink 应用于自身的业务场景,如底层平台建设、实时数仓、实时推荐、实时分析、实时大屏、风控、数据湖等场景中,解决实时计算的需求。
七大经典技术场景!Apache Flink 在多维领域应用的 40+ 实践案例
|
JavaScript 安全 前端开发
同源策略如何防止 XSS 攻击?
【10月更文挑战第31天】同源策略通过对 DOM 访问、Cookie 访问、脚本执行环境和跨源网络请求等多方面的严格限制,构建了一道坚实的安全防线,有效地防止了 XSS 攻击,保护了用户在网络浏览过程中的数据安全和隐私。
427 49
基于模糊PID控制器的汽车电磁悬架控制系统simulink建模与仿真
本课题基于MATLAB2022a,利用Simulink建模与仿真,研究了基于模糊PID控制器的汽车电磁悬架控制系统。该系统融合了模糊逻辑的非线性处理能力和PID控制器的稳定性与快速响应特性,以提高车辆行驶的舒适性和操控性能。通过动态调整悬架刚度和阻尼系数,适应不同路面条件和驾驶需求。仿真结果显示,模糊PID控制器显著优于无控制器和LQG控制器,在复杂路况下表现出更好的自适应控制能力,提升了车辆平稳性和应对紧急工况的能力。
|
存储 运维 安全
Spring运维之boot项目多环境(yaml 多文件 proerties)及分组管理与开发控制
通过以上措施,可以保证Spring Boot项目的配置管理在专业水准上,并且易于维护和管理,符合搜索引擎收录标准。
832 2
|
SQL 监控 关系型数据库
MySQL 如何保证主备的数据一致性的?
MySQL通过使用主从复制(Master-Slave Replication)来实现主备的数据一致性。主从复制是一种常见的数据复制技术,它将一个MySQL数据库服务器(主服务器)的数据复制到一个或多个其他MySQL数据库服务器(从服务器),以实现数据的冗余备份、读写分离等目的。以下是MySQL保证主备数据一致性的一些关键点: 1. **二进制日志(Binary Log)**:主服务器将所有的数据更改操作(如INSERT、UPDATE、DELETE)以二进制日志的形式记录下来,并定期将这些日志发送给从服务器。从服务器收到二进制日志后,按照主服务器的执行顺序逐条应用这些日志,从而保持数据的一致性
1751 0
|
人工智能 算法 搜索推荐
通义灵码在Python项目开发中的应用实践
通义灵码在Python项目开发中的应用实践
499 0
|
定位技术
获取本地IP以及地理位置
获取本地IP以及地理位置
|
算法 机器人 Python
Python实现教程:平面最短路径算法
Python实现教程:平面最短路径算法
452 1
|
存储 算法 安全
vscode用浏览器预览运行html文件
vscode用浏览器预览运行html文件
253 2

热门文章

最新文章