ECS主动运维2.0,体验升级,事半功倍

本文涉及的产品
轻量应用服务器 2vCPU 4GiB,适用于网站搭建
轻量应用服务器 2vCPU 4GiB,适用于搭建Web应用/小程序
轻量应用服务器 2vCPU 4GiB,适用于搭建容器环境
简介: 阿里云致力于提供更好用的运维体验,让您使用ECS的过程更透明、高效,并实现更加标准化、自动化的运维方式。基于主动运维2.0,您使用ECS云服务器的体验更加流畅,而且利用系统事件,不再依赖于工单联系客服,可以通过自助处理的方式响应主动运维实例重启,减少对系统可靠性和业务连续性的影响。

      云服务器 ECS(Elastic Compute Service)是一种弹性可伸缩的计算服务,助您降低 IT 成本,提升运维效率,使您更专注于核心业务创新。当您基于ECS云服务器搭建了业务系统,借助云计算的诸多优势和特性,可以实现对业务需求的敏捷响应和对业务连续性的有力保障。在此基础上,阿里云致力于提供更好用的运维体验,让您使用ECS的过程更透明、高效,并实现更加标准化、自动化的运维方式。


主动运维

      阿里云使用严格的IDC标准、服务器准入标准以及运维标准,保证云计算整个基础框架的高可用性、数据的可靠性以及云服务器的高可用性。对于单台ECS实例, 阿里云承诺一个服务周期内单台ECS实例的服务可用性不低于99.95%;对于单地域多可用区,阿里云承诺一个服务周期内该单地域多可用区的服务可用性不低于99.99%。

      我们知道,在基础设施层面,始终存在一些潜在因素如软件bug或硬件故障等会影响ECS实例的运行,因此为了保证上述高级别的服务可用性,除了云计算基础框架的高可用性设计以外,ECS主动运维不可或缺。主动运维作为ECS的隐形卫士,会主动对承载ECS实例运行的物理服务器做日常维护和故障检测,并尽可能通过在线或轮转升级的方式修复潜在的故障隐患,以持续提升系统可靠性、性能和安全防护能力,保障云服务器稳定运行。

      但对于某些情况,物理服务器需要重启或停机维护,这时主动运维系统会向该服务器上的ECS用户发送消息通知,提示您的ECS实例需要重启迁移至健康的物理服务器之上。此前,用户接到这样的通知后需要提交工单联系客服人员授权处理,随着主动运维2.0的进化,这方面的体验得到多方面的提升。


体验升级

1. 主动运维热迁移,实例运行不中断

      当主动运维检测到物理服务器存在故障风险时,系统会优先尝试将该服务器上的ECS实例在线热迁移至其他物理服务器,热迁移成功的实例不会中断运行,其业务可以保持在线;只有少量热迁移存在风险的实例才会进入主动运维重启迁移流程。此策略升级后,有效减少对用户业务连续性的冲击,在阿里云用户规模快速增长的情况下,主动运维相关工单数量同比下降125倍!

2. 风险提示更清晰,迁移影响提前知
      对于有必要进行重启迁移的实例,阿里云会提前向用户发送消息通知和针对性的提示。由于本地存储(本地盘)来自单台物理服务器,不基于多副本分布式技术,在迁移时本地盘所存储数据会被擦除,因此对于本地盘实例,通知中明确提示该风险并提醒您在迁移前及时备份数据。对于云盘实例,通知中提供操作引导,您不再需要提交工单联系客服人员,可以直接在控制台或通过API处理实例重启迁移。

3. 不用工单找客服,系统事件来帮忙
      云盘实例重启迁移的自助处理功能在控制台和API上线,当您受到重启迁移的系统计划事件时,可以知晓该事件的执行计划。如下图所示,根据您的业务需要,可以选择立即执行重启、预约在业务低峰期执行重启、或等待系统按计划执行,做有准备的运维操作。这样的过程不再需要依赖工单处理,提高效率的同时减少实例重启对您在行业务的冲击。
036785e95a5685c8d18c6f7a23dc9b7a8de702ee
08b9688d01c10cc3e8fe2b8d388fc77e4762d8bc


事半功倍

      正如上面提到的体验改进,“事”半功倍,除了主动运维流程进化,还来源于系统事件的发布。系统事件有利于提升用户对于ECS运行状态变化的感知,并进行有针对性的操作来响应或规避事件对在行业务的影响。通过系统事件的闭环,将更多的运维场景标准化、自动化,让用户获得更好的额云上运维体验。


玩转系统事件,更多信息可参考

相关实践学习
借助OSS搭建在线教育视频课程分享网站
本教程介绍如何基于云服务器ECS和对象存储OSS,搭建一个在线教育视频课程分享网站。
7天玩转云服务器
云服务器ECS(Elastic Compute Service)是一种弹性可伸缩的计算服务,可降低 IT 成本,提升运维效率。本课程手把手带你了解ECS、掌握基本操作、动手实操快照管理、镜像管理等。了解产品详情: https://www.aliyun.com/product/ecs
践远
+关注
目录
打赏
0
1
0
0
119
分享
相关文章
打怪升级不是梦!运维也能靠“游戏化”高效运转?试试看就知道了!
打怪升级不是梦!运维也能靠“游戏化”高效运转?试试看就知道了!
32 1
Dataphin智能化重磅升级!编码难题一扫光,开发运维更高效!
Dataphin重磅推出三大核心智能化能力:智能代码助手提升SQL开发效率;智能运维助手实现移动化任务管理;智能分析通过自然语言生成SQL,助力数据价值释放。未来将持续开放智能ETL、安全助手等能力,助力企业构建高效、稳定的数据资产体系。
72 0
破茧成蝶:阿里云应用服务器让传统 J2EE 应用无缝升级 AI 原生时代
本文详细介绍了阿里云应用服务器如何助力传统J2EE应用实现智能化升级。文章分为三部分:第一部分阐述了传统J2EE应用在智能化转型中的痛点,如协议鸿沟、资源冲突和观测失明;第二部分展示了阿里云应用服务器的解决方案,包括兼容传统EJB容器与微服务架构、支持大模型即插即用及全景可观测性;第三部分则通过具体步骤说明如何基于EDAS开启J2EE应用的智能化进程,确保十年代码无需重写,轻松实现智能化跃迁。
309 40
【产品升级】Dataphin V5.1版本发布:跨云数据集成、指标管理、平台运维带来重大更新!
V5.1版本新增多项功能:对接AWS生态(支持Amazon EMR、Redshift等),强化研发技术支撑(如API认证升级、全量任务隔离),完善运营消费链路(新增业务指标管理、指标关系图),提升平台综合能力(自定义菜单、缩短升级停机时间)。这些功能助力企业实现高效数据治理与分析,未来还将拓展智能化与国际化支持。
142 0
破茧成蝶:阿里云应用服务器让传统J2EE应用无缝升级AI原生时代
一场跨越20年的技术对话:在杭州某科技园的会议室里,一场特殊的代码评审正在进行。屏幕上同时展示着2005年基于WebLogic开发的供应链系统和2025年接入DeepSeek大模型的智能调度方案——令人惊叹的是,二者的核心业务代码竟保持着惊人的一致性。"我们保住了20年积累的238个核心业务对象,就像修复传世名画时保留了每一笔历史痕迹。"企业CTO的感慨,揭开了阿里云应用服务器助力传统系统智能化转型的奥秘。
96 13
摆脱繁琐命令-让运维更加流畅-阿里云ECS操作系统控制台运维篇
阿里云操作系统控制台提供了便捷的服务器监控与管理功能,简化了运维工作。通过将多台服务器纳入统一监控平台,用户可以快速查看CPU、内存、磁盘和网络等关键资源的使用情况,避免了逐一远程连接查询的繁琐操作。此外,该工具支持自动化数据汇总,极大地方便了日报、周报和月报的编写。测试过程中,系统展示了良好的稳定性和响应速度,尤其在网络抖动和大文件健康状态测试中表现出色。整体体验流畅,显著提升了运维效率。 操作系统控制台地址:[点击访问](https://alinux.console.aliyun.com/)
139 26
摆脱繁琐命令-让运维更加流畅-阿里云ECS操作系统控制台运维篇
机器学习+自动化运维:让服务器自己修Bug,运维变轻松!
机器学习+自动化运维:让服务器自己修Bug,运维变轻松!
192 14
GitHub 热门开源运维工具 Websoft9:如何实现服务器管理效率翻倍?
Websoft9 提供 200+ 开源应用一键部署,支持容器化隔离、GitOps 自动化和企业级安全防护,助力服务器管理效率提升 80%。
141 1
基于AI的自动化服务器管理:解锁运维的未来
基于AI的自动化服务器管理:解锁运维的未来
465 0
|
6月前
|
阿里云服务器批量执行命令(系统运维管理oos)
阿里云【系统运维管理oos】批量执行详情
146 5

热门文章

最新文章

相关产品

  • 云服务器 ECS
  • AI助理

    你好,我是AI助理

    可以解答问题、推荐解决方案等