阿里高可用架构建设实践经验
随着业务在线化互联网化的高速发展,企业对核心业务系统的稳定性、可靠性、有效性、业务连续性等有了更高的要求。采用高可用系统架构支持重要系统、为关键业务提供7x24的不间断服务,已经成为众多企业保障业务稳定、持续运转的主要选择。
分布式服务架构下的混沌工程实践
本文来自阿里巴巴高可用架构团队高级开发工程师肖长军(花名穹谷)在 GIAC(全球互联网架构大会)上的分享,包含三部分内容:(阿里巴巴中间件公众号对话框发送“混沌工程”,获取分享PPT)
混沌工程的定义、价值、原则和流程;
混沌工程如何在企业中落地,以及 ChaosBlade 和混沌实验平台 AHAS Chaos 架构设计;
结合两个具体案例介绍了分布式服务下的混沌工程实践;
大家好,我是来自阿里的肖长军,今天给大家分享混沌工程在分布式服务架构下的具体实践。
快速体验 Sentinel 集群限流功能,只需简单几步
️ Pic by Alibaba Tech on Facebook
集群限流 可以限制某个资源调用在集群内的总 QPS,并且可以解决单机流量不均导致总的流控效果不佳的问题,是保障服务稳定性的利器。
Sentinel 从 1.4.0 版本开始提供集群流控特性,但使用 Sentinel 集群限流需要对一系列的动态数据源进行相关配置,并且需要对开源控制台进行一些改造,有一定的使用成本。
好玩又实用,阿里巴巴开源混沌工程工具 ChaosBlade
减少故障的最好方法就是让问题经常性的发生。在可控范围或环境下,通过不断重复失败过程,持续提升系统的容错和弹性能力。
那么,实施一次高效的混沌工程实验,需要几步呢?
答案:2 步。
① 登陆 ChaosBlade
② 下载 release 版本,打造故障演练专属工具
高可用架构是保障服务稳定性的核心。
阿里巴巴在混沌工程领域的实践和思考
APM
文章摘自知乎专栏 知乎-应用高可用 https://zhuanlan.zhihu.com/p/52505917导读:
混沌工程(Chaos Engineering):是在分布式系统上进行实验的学科, 目的是建立对系统抵御生产环境中失控条件的能力以及信心。
从零开始入门 K8s | 可观测性:监控与日志
作者 | 莫源 阿里巴巴技术专家
一、背景
监控和日志是大型分布式系统的重要基础设施,监控可以帮助开发者查看系统的运行状态,而日志可以协助问题的排查和诊断。
在 Kubernetes 中,监控和日志属于生态的一部分,它并不是核心组件,因此大部分的能力依赖上层的云厂商的适配。
让开发变得更简单 | 阿里云中间件推出全新开发者服务
要码出未来,除了程序员专属的节日福利,还需要实打实的为程序员解决手头的难题。
10月24日,阿里云推出全新开发者服务,发布多款开发工具,包括Alibaba Cloud Toolkit 、链路追踪Tracing Analysis和应用高可用服务AHAS等,旨在帮助开发者们提高开发效率,降低运维复杂性。