《云上大型赛事保障白皮书》——第六章 云产品稳定性治理与风险管控——6.1 云产品稳定性治理——6.1.3 稳定性治理的思考与拓展

简介: 《云上大型赛事保障白皮书》——第六章 云产品稳定性治理与风险管控——6.1 云产品稳定性治理——6.1.3 稳定性治理的思考与拓展

6.1.3 稳定性治理的思考与拓展


当经历几次大型赛事的保障活动后,我们对于稳定性治理就有了进一步的思考:一个是“人”,一个是“时间”

人:通常来讲,稳定性治理是通过人进行巡检、发现问题并解决问题,这对于人的要求就很高,且可复用性会较差,那么我们是否能将稳定性治理场景化及工具化?

时间:大多数场景下,我们是被动的接收问题和处理问题,系统稳定性风险较大,耗费成本也极大。那么我们能否将动作前置,提前介入进行风险巡检,主动规避风险?

1684909796809.png


传统的巡检及诊断工具过度依赖工程师的经验以及事后复盘之后的诊断效率,导致开发迭代成本较高、使用风险较大。阿里云根据多年专家诊断以及重大活动重保经验,开发了Apsara1ServiceStack工具箱,其中包括CloudDoc/Advisor/智能诊断等工具。Apsara ServiceStack-CloudDoC是用于风险管理的工具,有三大亮点:

1)前置的资源健康评估,以售后、研发团队多年积累的海量问题特征库为依托。

2)对每个客户自动梳理潜在风险并提供解决方案。

3)让用户可以有机会在问题实际发生之前采取预发措施进行规避,大大提高诊断效率和降低售后人力成本。

针对30类云产品及各种使用特性,Apsara ServiceStack-CloudDoc通过巡检账号下资产各产品各专项的风险项,进行诊断并输出巡检报告。客户可以在任何周期进行风险巡检,并不断修复达到理想的健康评分。

image.png

图:Apsara ServiceStack-CloudDoc的诊断能力

相关文章
|
10月前
|
人工智能 监控 机器人
AI智能体开发指南:从门外汉到老司机
从零开始了解AI智能体的核心概念,区分工作流与智能代理,掌握实际构建技巧。让复杂的AI技术变得像聊天一样简单!
681 0
|
人工智能 安全 Java
对比测评:AI编程工具需要 Rules 能力
通义灵码Project Rules是一种针对AI代码生成的个性化规则设定工具,旨在解决AI生成代码不精准或不符合开发者需求的问题。通过定义编码规则(如遵循SOLID原则、OWASP安全规范等),用户可引导模型生成更符合项目风格和偏好的代码。例如,在使用阿里云百炼服务平台的curl调用时,通义灵码可根据预设规则生成Java代码,显著提升代码采纳率至95%以上。此外,还支持技术栈、应用逻辑设计、核心代码规范等多方面规则定制,优化生成代码的质量与安全性。
3134 115
|
10月前
|
存储 人工智能 自然语言处理
深度解析智能体工作流(Agentic Workflows):核心概念、模式与应用
本文系统解析智能体工作流(Agentic Workflow),结合AI智能体的推理、工具与记忆能力,实现复杂任务的动态执行。内容涵盖核心概念、关键模式及实际应用,帮助读者全面理解其价值与挑战。
7612 1
|
数据采集 存储 移动开发
关于数据埋点的认识以及在流量分析系统中的实际使用
关于数据埋点的认识以及在流量分析系统中的实际使用
1782 0
关于数据埋点的认识以及在流量分析系统中的实际使用
|
Oracle Java 关系型数据库
Java中的编码规范与代码审查实践
Java中的编码规范与代码审查实践
|
人工智能 监控 测试技术
|
数据采集 前端开发 搜索推荐
埋点tracker:前端数据埋点-方案设计思路梳理
埋点tracker:前端数据埋点-方案设计思路梳理
4505 0
|
Java Android开发 开发者
Android 悬浮窗功能的实现
Android 悬浮窗功能的实现
2096 2
Android 悬浮窗功能的实现