开发者社区> 问答> 正文

什么是弹性容错能力?

什么是弹性容错能力?

展开
收起
云上静思 2022-01-11 22:42:11 519 0
1 条回答
写回答
取消 提交回答
  • 除了在基础设施、数据上的容错能力外,云服务厂商通常也会提供应用服务的容错能力,帮助用户构建具备弹性、容错能力的分布式系统。

    • 弹性容错能力,分布式系统核心的两个弹性容错能力是流控与降级,通过流控来保护应用过载,通过降级来容忍业务部分有损换取整体可靠性。传统的流控方式是人工判断干预,高阶的方式是通过监控体系自动发现热点流量或异常流量,自动化选择自适应过载保护或者设置自动降级策略并执行。阿里云的 AHAS 提供了分布式应用调用链路的流量防护、应用间调用降级的解决方案。

    • 混沌工程与故障演练,混沌工程(Chaos Engineer)是一种提高分布式系统弹性能力的工程实践,通过主动制造故障,测试系统在各种压力下的行为,在生产环境提前识别潜在的故障,避免故障真实发生。故障演练是遵循混沌工程实验原理的实践之一,其建立了一套标准的演练流程,包含准备阶段、执行阶段、检查阶段和恢复阶段。通过四阶段的流程,覆盖用户从计划到还原的完整演练过程,并通过可视化的方式清晰呈现给用户。阿里云的 AHAS 产品提供了故障演练的完整解决方案,覆盖了主流的分布式解决方案,比如强弱依赖演练、消息演练、容器演练、容灾演练等。

    以上内容摘自《云上自动化运维(CloudOps)白皮书》电子书,点击https://developer.aliyun.com/topic/download?id=8190可下载完整版

    2022-01-12 14:16:14
    赞同 展开评论 打赏
来源圈子
更多
收录在圈子:
阿里云开发者社区官方技术圈,用户产品功能发布、用户反馈收集等。
问答排行榜
最热
最新

相关电子书

更多
构建确定性弹性的高可用云上应用网络 立即下载
云原生时代下的分布式云多集群管理-容灾,弹性,多集群负载分布 立即下载
千万QPS分布式系统架构设计和高效运维 立即下载