开发者社区 > 弹性计算 > 云服务器ECS > 正文

混沌工程的实践原则是什么?

已解决

混沌工程的实践原则是什么?

展开
收起
詹姆斯邦德00 2022-09-21 15:13:37 442 0
1 条回答
写回答
取消 提交回答
  • 推荐回答

    • 建立一个围绕稳定状态行为的假说:混沌工程要关注系统在发生不稳定事件时能否正常工作,而不是试图验证系统如何工作。

    • 多样化真实世界的事件:

    ü 首先,要对真实可能发生的事件进行实验,无需关心不可能发生的事件。

    ü 其次,要尽可能多地枚举出系统中可能发生问题的点,发生概率高或已经发生过的事件优先级靠前。

    • 在生产环境中运行实验:弹性计算的初期也无法在生产环境中运行实验,原因为系统稳定性不高,且可观测性不佳,在线上注入故障时无法很好地观测影响范围。 比如在代码隔离但数据不隔离的环境中实验时,完全无法测出系统真实的瓶颈点,因为任何微小的改变、任何与线上不同的点都会影响最终结果的准确性。所以我们提倡在生产环境中运行实验,能最大化验证发生问题时系统的表现。

    • 持续自动化运行实验:将性能作为回归的一部分,不仅需要功能的回归,还需要自动化的性能回归。

    • 最小化爆炸半径:当有足够强大的可观测性之后,要控制演练可能对系统造成的影响。演练的目的应该是验证系统薄弱点,而不是将系统彻底击溃。因此要控制演练范围,将影响降到最小,尽量不对线上用户造成过大影响。"

    以上内容摘自《云上自动化运维CloudOps系列沙龙演讲合集》电子书,点击https://developer.aliyun.com/ebook/download/7730可下载完成版

    2022-09-21 15:58:03
    赞同 展开评论 打赏
问答分类:

云服务器ECS是一种安全可靠、弹性可伸缩的IaaS级云计算服务。在这里你可以获取最新的ECS产品资讯、最前沿的技术交流以及优惠活动等信息,加速自己的技术成长。

相关电子书

更多
阿里云总监课第五期第二节:可靠性探索–利用混沌工程理念提高工程可靠性 立即下载
团队和工程管理取舍 立即下载
团队和工程管理的取舍 立即下载