筑牢高可用基石,AHAS赋能溪鸟安全生产探索与实践

本文涉及的产品
可观测监控 Prometheus 版,每月50GB免费额度
可观测可视化 Grafana 版,10个用户账号 1个月
应用实时监控服务-可观测链路OpenTelemetry版,每月50GB免费额度
简介: 本篇内容分享了筑牢高可用基石,AHAS赋能溪鸟安全生产探索与实践。

分享人:周洋 阿里云智能资深技术专家

正文:

本篇内容将通过个部分来介绍筑牢高可用基石,AHAS赋能溪鸟安全生产探索与实践。

一、阿里安全生产的发展

二、AHAS新能力探索与实践

image.png

一、阿里安全生产的发展

对于任何一个高速发展的企安全生产都是非常重要的。一次没有恰当处理的故障,会给客户体验。公司品牌带来影响在阿里巴巴安全生产体系中,有两个组成部分第一,企业的架构要具备高可用能力。第二,企业组织也要具备相关的韧性所以我们形成了两相对完整的指导的体系在长时间发展过程中,这两个体系一直在螺旋上升

我们从三个维度度量企业技术的综合实力第一个指标,故障应急对于单故障事件,我们要求技术人员在1分钟发现5分钟内定位10分钟恢复第二个指标,业务可能率指标统计当前因为各种非预期故障导致系统不可用的时间,对全局带来的影响。第三个指标,灾难性故障,我们会从RTO和RPO两个指标来衡量通过这三个维度,我们可以时刻量化当天企业安全生产的能力在过去几年,我们把整套安全生产理念,通过产品矩阵化的方式输出它的平台就叫AHAS应用高可用平台。

为了解决容错问题,我们提升你的容错能力。在这个领域,诞生混沌工程产品稳定性防护产品技术为了解决容灾能力,我们也有异地多模容灾架构的解决方案而在性能可观测性方面,我们也会有相关的产品

image.png

二、AHAS新能力探索与实践

容灾解决方案2.0以客户视角来看,它以客户应用业务为中心的原生方案如果企业刚刚上云,可以充分利用不同的可用区之间的机器达到互相容灾的效果如果采用最新发布的这一套产品,企业可以在代码几乎不改造的情况下达到同城容灾能力

如果企业增量非常快,资源不够用,可能因为地域的灾难导致问题,以考虑采用异地双活架构,在这套架构下,我们给客户提供两种模式如果当前业务发展压力较大,在选址的时候可以就近的两个地域,我们会帮你实现机房流量的封闭以及数据库公用如果希望一次性把事情做到位可以考虑从应用层到底层的数据全部封闭的架构异地多活架构如果企业上云的过程持续很久,我们会推荐客户去做混合运容灾的架构

image.png

经过10年经验积累我们200支持多个固定的场景支撑Linuxwindows平台,让更多的企业享受混沌工程的能力。微服务方面,支持服务级别强弱依赖自动化验让企业更好地实现微服务的容错处理。第二,多样化的演练形式帮助企业做自动化的架构梳理可以灵活自由的自定义演练机器与场景。经验库一键演练和高阶演练方案,让企业按需配置。

第三,易用的演练平台。 Chaos平台支持业务0改造,一键接入。业务系统架构实现自动化感知。我们的社区版已经在线托管至企业版,大家可以一键升级至企业版。第四,安全的演练保障。我们有多种演练恢复策略,多维度的权限管控,以及应用级别的爆炸半径。成功实现演练的安全可控。

image.png

业务系统全方位可用性防护今年支持Nginx/Ingress 层面流控技术,可以更细致地实现API层面的流控,并且支持一键式的开箱即用。第二,它免运维的方式,让大家更简单实施集权流,更便捷解决传统流控带来的单机流量不均问题

image.png

最后,我们讲一讲性能压测领域的升级全链路压测被称为大促备战核武器通过近几年的压测,我们发现每一次的峰值都会比前一次的峰值更猛烈。而且大家备战促销的流程越来越频繁所以这次升级主要有两个新的特性。第一支持各种业务场景压测。第二,在阿里内部的全链路压测技术架构下,企业架构不用做任何的改造,基于Agent 无侵入技术的生产环境全链路压测更全面、精准的验证系统。

相关文章
|
SQL 运维 监控
|
安全 应用服务中间件 AHAS
《筑牢高可用基石,AHAS 赋能溪鸟安全生产探索与实践》电子版地址
筑牢高可用基石,AHAS 赋能溪鸟安全生产探索与实践.ppt
80 0
《筑牢高可用基石,AHAS 赋能溪鸟安全生产探索与实践》电子版地址
|
测试技术 应用服务中间件 AHAS
冬季实战营第四期:基于PTS&AHAS完成线上应用最佳状态的实践,直播学习笔记
冬季实战营第四期:基于PTS&AHAS完成线上应用最佳状态的实践
148 0
冬季实战营第四期:基于PTS&AHAS完成线上应用最佳状态的实践,直播学习笔记
|
应用服务中间件 AHAS 监控
阿里云应用高可用 AHAS 正式商用,可一键提升云上应用可用性
在分布式架构环境下,服务间的依赖日益复杂,可能没有人能说清单个故障对整个系统的影响,构建一个高可用的分布式系统面临着很大挑战。 7月17日,阿里云应用高可用服务AHAS 正式商用,包含架构感知、流控降级和故障演练三大独立的功能模块,可快速提高应用的高可用能力,解决分布式架构下的高可用难题。
3404 10
应用高可用 AHAS 一键提升云上的业务可用性
在分布式架构环境下,服务间的依赖日益复杂,可能没有人能说清单个故障对整个系统的影响,构建一个高可用的分布式系统面临着很大挑战。 近日,阿里云高可用服务 AHAS 正式商用,提供限流降级、架构可视化、故障注入,可一键提升应用可用性,我们邀请了阿里巴巴高可用架构团队高级开发工程师云寅分享: 云上业务的可用性有5个9的要求,该如何提高? 如何评估分布式系统的容错性、系统容灾红线和云资源扩展能力? 系统架构复杂度越来越高,架构变化日益频繁,如何识别架构中存在的问题? 直播报名地址:点击这里。
12378 13
|
SQL 应用服务中间件 AHAS
阿里云应用高可用服务 AHAS 流控降级实现 SQL 自动防护功能
在影响系统稳定性的各种因素中,慢 SQL 是相对比较致命的,可能会导致 CPU、LOAD 异常、系统资源耗尽。线上生产环境出现慢 SQL 往往有很多原因: 硬件问题。如网络速度慢,内存不足,I/O 吞吐量小,磁盘空间满等。
3912 11
|
消息中间件 监控 Cloud Native
阿里云AHAS Chaos:应用及业务高可用提升工具平台之故障演练
阿里云AHAS Chaos:应用及业务高可用提升工具平台之故障演练
阿里云AHAS Chaos:应用及业务高可用提升工具平台之故障演练
|
关系型数据库 应用服务中间件 数据库
【阿里云新品发布·周刊】第18期:应用高可用服务 AHAS 商业化首发,一步提升应用可用性
点击订阅新品发布会! 新产品、新版本、新技术、新功能、价格调整,评论在下方,下期更新!关注更多内容,了解更多 最新发布 应用高可用服务 AHAS 商业化首发 2019年7月17日15时,应用高可用服务 AHAS 商业化首发。
2348 0
|
数据可视化 应用服务中间件 AHAS
免费的容器架构可视化工具 | 阿里云应用高可用服务 AHAS 发布重大新特性
采用容器服务后,了解容器之间的关系及依赖是一个比较有挑战的问题。容器化改造后的实际架构模型可能与预想的架构存在较大的差异,架构师或系统运维人员需要精确地了解资源实例的构成和交互情况,存在一定的困难。其次,系统架构在动态演化过程中可能引入了一些不可靠的因素,比如弱依赖变强依赖、局部容量不足、系统耦合过重等,给系统的稳定性带了极大的安全隐患。
21777 0
|
6月前
|
Java Serverless 应用服务中间件
Serverless 应用引擎产品使用之在Serverless 应用引擎中跳过AHAS创建如何解决
阿里云Serverless 应用引擎(SAE)提供了完整的微服务应用生命周期管理能力,包括应用部署、服务治理、开发运维、资源管理等功能,并通过扩展功能支持多环境管理、API Gateway、事件驱动等高级应用场景,帮助企业快速构建、部署、运维和扩展微服务架构,实现Serverless化的应用部署与运维模式。以下是对SAE产品使用合集的概述,包括应用管理、服务治理、开发运维、资源管理等方面。
141 3

相关产品

  • 应用高可用服务