《云上大型赛事保障白皮书》——第六章 云产品稳定性治理与风险管控——6.2 北京冬奥稳定性治理实践——6.2.3 冬奥重保--风险巡检(1)

简介: 《云上大型赛事保障白皮书》——第六章 云产品稳定性治理与风险管控——6.2 北京冬奥稳定性治理实践——6.2.3 冬奥重保--风险巡检(1)

6.2.3 冬奥重保--风险巡检


整体的风险巡检的逻辑分为产品和场景两部分。

产品方面,当前我们的各产品方已经有了各类巡检平台,针对不同产品特性及潜在风险,我们可以进行巡检项的配置。比如针对ECS产品,我们的可配置项有以下

•单机容错能力 & 共享型实例风险。

•禁止资源腾挪类热迁移。

•rlock资源预留。

•实例打散度确认。

•ECS实例所在宿主机风险巡检。

对于数据库产品的巡检,可以参考如下的脑图:

image.png图:数据库监控巡检项


针对不同的业务场景,Aspara ServiceStack-CloudDoc也可以针对对应的场景进行场景化针对性巡检并输出相应报告及修复建议,例如:

高可用:负载均衡后端单点风险,CDN单源站风险,多VM聚集在同一底层宿主机风险等等。

安全:公网暴露IP地址DDOS风险。

数据冗余:ECS快照冗余风险、MySQL数据备份风险。

性能:ECS共享实例争抢风险、RDS共享实例争抢风险。

同时在这期间定制化输出了开发SLB挂载机器跨可用区检测能力,定制增加异常事件、优化建议、优化SQL等能力,经过冬奥会的实践,我们反向增强了Aspara ServiceStack-CloudDoc巡检工具的能力。

image.png

图:Aspara ServiceStack-CloudDoc巡检报告封面



《云上大型赛事保障白皮书》——第六章 云产品稳定性治理与风险管控——6.2 北京冬奥稳定性治理实践——6.2.3 冬奥重保--风险巡检(2): https://developer.aliyun.com/article/1226138?groupCode=supportservice

相关实践学习
通义万相文本绘图与人像美化
本解决方案展示了如何利用自研的通义万相AIGC技术在Web服务中实现先进的图像生成。
7天玩转云服务器
云服务器ECS(Elastic Compute Service)是一种弹性可伸缩的计算服务,可降低 IT 成本,提升运维效率。本课程手把手带你了解ECS、掌握基本操作、动手实操快照管理、镜像管理等。了解产品详情: https://www.aliyun.com/product/ecs
相关文章
|
7月前
|
存储 人工智能 缓存
AI变革药物研发:深势科技的云原生实践之路
阿里云助力深势科技推出创新的玻尔Bohrium®科研云平台和Hermite®药物计算设计平台,并持续完善。这两项先进的工业设计与仿真基础设施成果通过AI技术赋能科学研究和工业研发,不仅大幅缩短了药物研发周期,降低了成本,还显著提高了研发成功率,为生物医药行业带来了前所未有的变革,这是AI for Science领域的重大突破。
441 38
|
12月前
|
机器学习/深度学习 供应链 搜索推荐
深度学习之需求预测
基于深度学习的需求预测在商业、物流、医疗、能源等多个行业中发挥着重要作用,帮助优化资源分配、提升效率、降低成本。
1207 0
|
7月前
|
人工智能 自然语言处理 运维
又稳又快!阿里云飞天企业版支撑多家政企云上部署DeepSeek和通义千问
又稳又快!阿里云飞天企业版支撑多家政企云上部署DeepSeek和通义千问
|
11月前
|
Java 容器
springboot自动配置原理
启动类@SpringbootApplication注解下,有三个关键注解 (1)@springbootConfiguration:表示启动类是一个自动配置类 (2)@CompontScan:扫描启动类所在包外的组件到容器中 (3)@EnableConfigutarion:最关键的一个注解,他拥有两个子注解,其中@AutoConfigurationpackageu会将启动类所在包下的所有组件到容器中,@Import会导入一个自动配置文件选择器,他会去加载META_INF目录下的spring.factories文件,这个文件中存放很大自动配置类的全类名,这些类会根据元注解的装配条件生效,生效
|
存储 安全 Cloud Native
阿里云推出创业者计划介绍,加入计划可获得最低3500元,最高100万抵扣金
阿里云创业者计划是面向中小企业推出的一项扶持计划,致力于为中小企业构建智能时代的核心竞争力,同时聚合众多知名投资机构、加速器、孵化器和大企业创新力量,向中小企业提供全方位的赋能与服务。成功加入计划后,阿里云将提供最低3500元、最高100万元的上云抵扣金,让中小企业享受免费的云资源和技术服务,助力初创企业开启智能时代创业新范式。
阿里云推出创业者计划介绍,加入计划可获得最低3500元,最高100万抵扣金
|
Java 测试技术 Maven
maven跳过单元测试-maven.test.skip和skipTests的区别
maven跳过单元测试-maven.test.skip和skipTests的区别
329 0
|
中间件 测试技术 Go
Golang中的错误处理最佳实践
【7月更文挑战第10天】在Golang中,错误处理是核心且重要的。最佳实践包括:定义明确的错误类型,使用错误链(如`%w`包装错误),始终检查错误(避免忽略),谨慎使用`panic`和`recover`,利用多值返回处理错误,标准化错误处理逻辑,并确保测试错误处理代码。这些做法有助于构建健壮和可维护的程序。
|
前端开发 测试技术 数据库
农场游戏开发稳定版丨农场游戏系统开发规则分析
农场游戏系统开发涉及五个主要阶段:需求收集与分析(确定游戏目标和玩法)、游戏设计(规划结构和流程,设计界面和音效)、游戏开发(编写程序,开发后端和前端功能)、测试与优化(功能和性能测试,根据反馈调整)以及发布与运营(上线推广,持续运行、维护和更新)。
|
前端开发
后端一次返回大量数据,前端做分页处理
后端一次返回大量数据,前端做分页处理
321 0
|
XML 安全 网络安全
开发实战(5)--如何编写fofa脚本进行资产的信息收集
主要还是围绕渗透测试的流程进行开发,一般在信息收集后,在渗透测试后,在发现通用型漏洞时,我们为了节省时间,可以通过写批量脚本来信息收集,然后使用poc来进行批量验证. 作为一个fofa工程师,那么我们当然是使用fofa进行信息搜集喽,刚好也借着这个机会熟悉一下fofa的API文档,为后面写利用工具做好铺垫