在分布式架构环境下,服务间的依赖日益复杂,可能没有人能说清单个故障对整个系统的影响,构建一个高可用的分布式系统面临着很大挑战。
近日,阿里云高可用服务 AHAS 正式商用,提供限流降级、架构可视化、故障注入,可一键提升应用可用性,我们邀请了阿里巴巴高可用架构团队高级开发工程师云寅分享:
直播报名地址:点击这里。
直播时间:7月17日
- 云上业务的可用性有5个9的要求,该如何提高?
- 如何评估分布式系统的容错性、系统容灾红线和云资源扩展能力?
- 系统架构复杂度越来越高,架构变化日益频繁,如何识别架构中存在的问题?
流控(限流)降级
流控降级 Sentinel 是面向分布式服务架构的专业流量控制组件,主要以流量为切入点,从流量控制(限流)、熔断降级、系统保护等多个维度来帮助您保障服务的稳定性,同时提供强大的聚合监控和历史监控查询功能。
使用场景
流控(限流)降级 Sentinel,由阿里巴巴集团自主研发, 是阿里巴巴双十一使用的核心产品。在阿里巴巴近 10 年的双十一大促的核心场景中,该产品都充当重要角色。例如,在秒杀场景中,保证了突发流量控制在系统容量可以承受的范围内;在消息削峰填谷、集群流量控制、实时熔断下游不可用应用等场景中,也得到了广泛的应用。
故障演练
故障演练是一款遵循混沌工程实验原理并融合了阿里巴巴内部实践的产品,提供丰富故障场景实现,能够帮助分布式系统提升容错性和可恢复性。
使用场景
- 衡量微服务的容错能力
- 验证容器编排配置是否合理
- 测试 PaaS 层是否健壮
- 验证监控告警的时效性
- 定位与解决问题的应急能力
架构可视化
AHAS 的架构感知模块能够自动感知您的系统架构,以可视化的方式直观呈现应用对基础架构的依赖关系,以及组件间的依赖关系。
使用场景
采用微服务和容器服务后,了解服务之间的关系及依赖是一个比较有挑战的问题。改造后的实际架构模型可能与预想的架构存在较大的差异,架构师或系统运维人员需要精确地了解资源实例的构成和交互情况,存在一定的困难。其次,系统架构在动态演化过程中可能引入了一些不可靠的因素,比如弱依赖变强依赖、局部容量不足、系统耦合过重等,给系统的稳定性带了极大的安全隐患。所以我们每次在面对系统改造、业务大促、迁移上云以及稳定性治理工作之前,都会通过梳理架构图的方式,呈现系统架构中个组件之间的交互方式,架构可视化能够清晰的协助我们识别架构中存在的问题以及建立高可用的系统。