如何提高业务系统的稳定性

本文涉及的产品
应用型负载均衡 ALB,每月750个小时 15LCU
传统型负载均衡 CLB,每月750个小时 15LCU
网络型负载均衡 NLB,每月750个小时 15LCU
简介: 【6月更文挑战第21天】如何提高业务系统的稳定性

可以说,业务系统是企业的门面,业务系统的稳定性,直接决定这用户对于企业的信任度。对于业务系统来说,业务系统的问题最直接影响的就是用户的体验,耗费的也是用户对于企业的信任值。那么如何提高业务系统的稳定性呢?

业务系统初始

业务系统初始时刻,企业为了可以快速上线来把握用户,往往会采用比较直接易构建的方式,比如:单点架构。单点架构是一种常见的部署架构,满足业务基本需要,通常是由一台服务器,一个单节点数据库组成。这样的架构上线操作简单,不用过多的考虑数据共享问题,上线周期短。


但是同样的,带来的劣势也很明显:

稳定性不够,单一节点故障,业务系统整个不能用;

弹性能力不够,当用户量波动时,峰值用户量可能会导致业务系统无法响应,扩容成本高;

升级不变,每次系统升级都需要停机升级,降低用户体验,且后期的服务管理不便。


随后,就出现了主从服务架构,这样在一定程度上缓解了单点架构带来的问题,但是仍然不是最优解决方案。那么这里来介绍一种云上版高可用架构。

云上高可用架构

在介绍云上高可用架构之前,我们先来看一款简版的架构图

image.png

当用户访问应用时,用户的请求会经过负载均衡ALB的转发策略,负载均衡会按照一定规则转发用户请求到具体的云服务器ECS,当其中任何一台云服务器ECS服务不可用或者宕机,负载均衡检测的服务不可用时,会自动将请求转发至其他的云服务器ECS,这样就保证了业务系统的高可用性。数据库采用的是云数据库RDS MySQL版,将能最大限度的保证企业业务数据的安全性。同时,ALB、ECS、RDS均具备跨可用区的自动备份和灾难恢复能力,这也进一步确保关键数据的稳定性和安全。


基于以上对于云上高可用架构的理解,下面我们再来看看以下的讨论。

如何降低日常业务中断的风险,比如停机发布,单机故障等?

有了以上云上高可用架构的理解之后,那么对于如何降低日常业务中断风险,就有了一个较好的解决方案。云上高可用架构本质上就是为了解决单击故障,那么采用了云上高可用架构之后,单击故障自然也就不存在了。至于停机发布,上面也说了,负载均衡ALB会时刻检测云服务器ECS的应用服务状态,因此你在操作业务系统升级时,可以直接逐个停掉对应的单点云服务器ECS进行升级操作,升级完成后重启业务系统应用后,负载均衡ALB会自动检测到服务状态从而为服务分发请求,这也就解决了停机发布的窘境。

如何提升应用服务的负载均衡能力?

对于如何提升应用服务的负载均衡能力,当业务系统量较大,可以通过自动水平扩展的方式来增加云服务器ECS提供服务,通过负载均衡ALB来均匀分发用户请求,保证每一台云服务器ECS的响应处理都在其可承受的范围内。为了保证数据库的稳定运行,也可以辅以云数据库的Serverless 弹性伸缩能力,当业务系统请求量大时,自动弹性扩展数据库服务节点;当业务量恢复正常时,则自动弹性节减数据库服务节点,从而保证业务系统的服务没有明显变化,提升用户体验。

相关实践学习
2分钟自动化部署人生模拟器
本场景将带你借助云效流水线Flow实现人生模拟器小游戏的自动化部署
7天玩转云服务器
云服务器ECS(Elastic Compute Service)是一种弹性可伸缩的计算服务,可降低 IT 成本,提升运维效率。本课程手把手带你了解ECS、掌握基本操作、动手实操快照管理、镜像管理等。了解产品详情: https://www.aliyun.com/product/ecs
相关文章
|
监控 数据可视化 数据库
服务监控:保障业务稳定运行的关键
随着数字化时代的到来,企业和组织对于其在线服务的可用性和性能提出了越来越高的要求。服务监控成为了确保业务连续性的关键工具之一。在本文中,我们将深入探讨服务监控的重要性,以及如何建立一个高效的监控系统来保障业务的稳定运行。
|
消息中间件 缓存 监控
系统稳定性建设实践总结
2020年,注定是个不平凡的一年。疫情的蔓延打乱了大家既定的原有的计划,同时也催生了一些在线业务办理能力的应用诉求,作为技术同学,需要在短时间内快速支持建设系统能力并保障其运行系统稳定性。恰逢年终月份,正好梳理总结下自己的系统稳定性建设经验和思考。
系统稳定性建设实践总结
|
2月前
|
存储 运维 安全
中断向量表的大小是否会影响系统的稳定性?
【10月更文挑战第29天】中断向量表的大小与系统的稳定性密切相关。合理设置中断向量表的大小,并采取有效的管理和保护措施,对于确保系统的稳定运行至关重要。在系统设计和开发过程中,需要充分考虑系统的当前和未来需求,权衡中断向量表大小对系统稳定性的各种影响,以实现系统的高性能和高稳定性。
51 4
|
8月前
|
监控 NoSQL 中间件
中间件系统整体可用性降低
中间件系统整体可用性降低的原因可能涉及多个方面
55 1
|
8月前
|
缓存 运维 监控
|
消息中间件 监控 Java
系统稳定性保障设计总结和思考
系统稳定性保障设计总结和思考
565 0
《云上业务稳定性保障实践白皮书》——五.行业客户稳定性保障实践——5.3 平台网站业务稳定性保障——5.3.4故障演练与紧急预案设计
《云上业务稳定性保障实践白皮书》——五.行业客户稳定性保障实践——5.3 平台网站业务稳定性保障——5.3.4故障演练与紧急预案设计
205 0
|
SQL 监控 关系型数据库
《云上业务稳定性保障实践白皮书》——五.行业客户稳定性保障实践——5.3 平台网站业务稳定性保障——5.3.2 全链路压测与容量评估(3)
《云上业务稳定性保障实践白皮书》——五.行业客户稳定性保障实践——5.3 平台网站业务稳定性保障——5.3.2 全链路压测与容量评估(3)
220 0
|
监控 测试技术 UED
《云上业务稳定性保障实践白皮书》——五.行业客户稳定性保障实践——5.3 平台网站业务稳定性保障——5.3.2 全链路压测与容量评估(1)
《云上业务稳定性保障实践白皮书》——五.行业客户稳定性保障实践——5.3 平台网站业务稳定性保障——5.3.2 全链路压测与容量评估(1)
316 0
|
域名解析 网络协议 数据可视化
《云上业务稳定性保障实践白皮书》——五.行业客户稳定性保障实践——5.3 平台网站业务稳定性保障——5.3.2 全链路压测与容量评估(2)
《云上业务稳定性保障实践白皮书》——五.行业客户稳定性保障实践——5.3 平台网站业务稳定性保障——5.3.2 全链路压测与容量评估(2)
230 0