真正云原生的智能运维体系,阿里云发布ECS自动化运维套件

本文涉及的产品
轻量应用服务器 2vCPU 1GiB,适用于搭建电商独立站
轻量应用服务器 2vCPU 4GiB,适用于网站搭建
轻量应用服务器 2vCPU 4GiB,适用于搭建容器环境
简介: ECS自动化运维套件是真正为云而生的自动化运维体系,能发挥云的最大价值,也能让企业享受云的技术红利。”阿里云弹性计算负责人张献涛表示。

云计算的发展,推动了自动化运维、DevOps、AIOps 等趋势的兴起,在业务快速变化的今天,企业希望通过一套自动化运维的专家系统提高运维效率,为业务提供支撑。

传统的方式下,打造一套成熟的 DevOps 流程需要有大量的技术投入,如果采用商业软件还会有不菲的支出。无论是哪一项,都意味着大量的时间成本和财务成本支出。云计算正在改变这种情况。

为云而生的 ECS 自动化运维套件

2 月 3 日,阿里云宣布推出 ECS(Elastic Compute Service,弹性计算服务)自动化运维套件。这是一套无需自行部署、云原生的免费产品能力,可以帮助企业实现从 IT 架构的规划、迁移、部署、弹性扩缩容,到日常管理,覆盖云基础设施全生命周期的自动化运维。

运维套件.png

“ECS 自动化运维套件是真正为云而生的自动化运维体系,能发挥云的最大价值,也能让企业享受云的技术红利。”阿里云弹性计算负责人张献涛表示。

据阿里云介绍,ECS 自动化运维套件涵盖服务器迁移中心、资源编排、运维编排等 13 个工具,覆盖跨地域部署、定时快照等 20 多个常见运维场景。利用阿里云自动化运维套件,企业在迁移、部署和扩容的场景下,能实现最高 10 倍的效率提升,实现从人工到自动的质变。

今天,企业在云上需要管理数十万的云服务器,如何高效地批量管理成为重要问题;即便是中小型客户,自建机房还是在云上,都需要完成类似上线下线、扩缩容、升级回滚等主要运维操作,成熟的自动化运维能力无疑已经成为了企业的必备能力。

如果运维团队都选择自己写脚本或开发自动化工具,可能开发多达数十种自动化工具。不同业务方使用的开发环境和组件不同,可能需要为不同业务方开发不同的自动化工具,这无疑再次提升了成本。云则提供了一种标准化和低成本的选择。

阿里云透露,在过去一年,新推出的运维编排工具 OOS 用户量翻了 10 倍,每月有100万次的自动化运维操作通过 OOS 模板完成;超过 100 万云资源通过资源编排 ROS 创建;弹性伸缩功能 ESS 每月所支撑的扩缩容资源量超过 30 万台云服务器,这些数据体现云上自动化运维工具对企业的巨大价值。相关的功能已经服务了超过近万家企业客户以及数十万个人用户。

如今,阿里云弹性计算将一整套自动化运维能力体系化、产品化输出,重磅发布“阿里云 ECS 自动化运维套件”,让用户可以在云上构建全流程的自动化运维体系。

ECS 自动化运维套件的四大特点

受制于历史遗留、企业规模或成本等因素,不同企业的 IT 运维自动化程度参差不齐。阿里云在调研过程发现,当前企业的自动化运维离完全的 AIOps 还有很大距离。但很多企业都已经实现了半自动化,甚至有企业实现了高度自动化。

自动化等级金字塔.png

如今,基础设施即代码、自动化、智能化等趋势在运维领域已是大势所趋,阿里云 ECS 自动化运维套件的设计充分体现了这些特点。同时,作为一套通用的运维工具,它考虑到不同企业业务场景的多样性,给企业提供了大量基础能力与原子能力,有很大自由度。

相关产品负责人总结,ECS 自动化运维套件有以下四大优势。

全流程覆盖:该套件涵盖从迁云、部署、紧急扩缩容到日常自动化运维等环节,覆盖了企业使用云服务器的全生命周期管理,真正实现基础设施即代码。

灵活自定义:其中事件驱动体系、基于自动化部署与编排等工具,允许客户根据自身高频业务场景,制作适合自身的业务模板让机器自动完成,支持对外分享。同时该套件支持 terroform 等开源工具。

敏捷高效:模板化、代码化的设计,将高频、批量或要求快速响应的操作,用机器代替人工,帮助企业快速实现运维基础服务自动化,从而加速 DevOps,最大化提高运维效率,告别人肉操作,提升运维人员幸福感。

智能易用:套件中所有自动化运维工具无需安装开箱即用。其中的自动化选型、实例智能诊断与修复、资源顾问和一键迁云工具等多种能力,都可以智能地完成复杂任务,免去人工学习与操作。

同时,该套件体现了模板化或代码化的理念。阿里云相信,标准化、模板化、代码化的自动化运维,将是 AIOps 的基础,因为只有所有运维工作都可以被自动化、所有自动化工作都非常规范和标准时,AI 才有机会进行学习,AIOps 才可能成为现实。

注:关于自动化运维套件的系统化介绍,欢迎大家下载《阿里云 ECS 自动化运维套件白皮书》https://developer.aliyun.com/topic/download?id=1112

助力企业低成本构建自动化运维体系

在传统IT时代,建设成熟的运维平台只是大型企业的专利,小型企业只能使用开源工具,或者自己开发简单的自动化工具。而今天,无论是只有两个人的初创团队,还是成千上万人的成熟企业,都能够在阿里云上建设自己的自动化工具。

阿里云作为聚合了百万用户的云平台,积累下了丰富的应用架构模板、场景化的自动化运维模板。这使得所有阿里云的用户都可以零成本获取最成熟的自动化运维方案。多样化的自定义功能加上事件体系,让用户可以低成本的构建一套稳定安全的云上 DevOps 方案。

再者,阿里云提供的产品能力是不断的向前迭代,使得企业不仅仅是依靠自身能力去构建 DevOps 体系,而是有了云平台能力进化的加成。

“每家企业上云之后就像配备了一个先进的、不断进化的工厂,不需要从零开始搭建,每一台机器和每一条流水线都随时听从调遣。这也是我们倡导 Cloud DevOps 的原因。”张献涛表示。

相关实践学习
快速体验PolarDB开源数据库
本实验环境已内置PostgreSQL数据库以及PolarDB开源数据库:PolarDB PostgreSQL版和PolarDB分布式版,支持一键拉起使用,方便各位开发者学习使用。
7天玩转云服务器
云服务器ECS(Elastic Compute Service)是一种弹性可伸缩的计算服务,可降低 IT 成本,提升运维效率。本课程手把手带你了解ECS、掌握基本操作、动手实操快照管理、镜像管理等。了解产品详情: https://www.aliyun.com/product/ecs
相关文章
|
17天前
|
运维 监控 数据可视化
一文拆解 YashanDB Cloud Manager,数据库运维原来还能这么“智能”!
传统数据库运维依赖人工,耗时耗力还易出错。YashanDB Cloud Manager(YCM)作为“智能运维管家”,实现主动、智能、可视化的运维体验。它提供实时资源监控、智能告警系统、自动巡检机制、高可用架构支持和强大的权限管理功能,帮助用户统一管理多实例与集群,减少人工干预,构建现代化数据库运维体系,让企业高效又安心地运行数据库服务。
|
27天前
|
消息中间件 运维 监控
智能运维,由你定义:SAE自定义日志与监控解决方案
通过引入 Sidecar 容器的技术,SAE 为用户提供了更强大的自定义日志与监控解决方案,帮助用户轻松实现日志采集、监控指标收集等功能。未来,SAE 将会支持 istio 多租场景,帮助用户更高效地部署和管理服务网格。
264 51
|
19天前
|
Cloud Native Serverless 流计算
云原生时代的应用架构演进:从微服务到 Serverless 的阿里云实践
云原生技术正重塑企业数字化转型路径。阿里云作为亚太领先云服务商,提供完整云原生产品矩阵:容器服务ACK优化启动速度与镜像分发效率;MSE微服务引擎保障高可用性;ASM服务网格降低资源消耗;函数计算FC突破冷启动瓶颈;SAE重新定义PaaS边界;PolarDB数据库实现存储计算分离;DataWorks简化数据湖构建;Flink实时计算助力风控系统。这些技术已在多行业落地,推动效率提升与商业模式创新,助力企业在数字化浪潮中占据先机。
103 12
|
15天前
|
机器学习/深度学习 人工智能 运维
AI为网络可靠性加“稳”——从断网烦恼到智能运维
AI为网络可靠性加“稳”——从断网烦恼到智能运维
75 2
|
20天前
|
运维 Cloud Native 应用服务中间件
阿里云微服务引擎 MSE 及 云原生 API 网关 2025 年 3 月产品动态
阿里云微服务引擎 MSE 面向业界主流开源微服务项目, 提供注册配置中心和分布式协调(原生支持 Nacos/ZooKeeper/Eureka )、云原生网关(原生支持Higress/Nginx/Envoy,遵循Ingress标准)、微服务治理(原生支持 Spring Cloud/Dubbo/Sentinel,遵循 OpenSergo 服务治理规范)能力。API 网关 (API Gateway),提供 APl 托管服务,覆盖设计、开发、测试、发布、售卖、运维监测、安全管控、下线等 API 生命周期阶段。帮助您快速构建以 API 为核心的系统架构.满足新技术引入、系统集成、业务中台等诸多场景需要
|
1月前
|
存储 人工智能 运维
idc机房智能运维解决方案
华汇数据中心一体化智能运维方案应运而生,以“自主可控、精准洞察、智能决策”三大核心能力,助力企业实现运维效率提升与综合成本下降的数字化转型目标。
111 24
|
1月前
|
数据采集 机器学习/深度学习 人工智能
智能运维在IT管理中的实践与探索
【10月更文挑战第21天】 本文深入探讨了智能运维(AIOps)技术在现代IT管理中的应用,通过分析其核心组件、实施策略及面临的挑战,揭示了智能运维如何助力企业实现自动化监控、故障预测与快速响应,从而提升整体运维效率与系统稳定性。文章还结合具体案例,展示了智能运维在实际环境中的显著成效。
102 26
|
1月前
|
机器学习/深度学习 人工智能 运维
机器学习+自动化运维:让服务器自己修Bug,运维变轻松!
机器学习+自动化运维:让服务器自己修Bug,运维变轻松!
105 14
|
1月前
|
消息中间件 运维 监控
智能运维,由你定义:SAE自定义日志与监控解决方案
SAE(Serverless应用引擎)是阿里云推出的全托管PaaS平台,致力于简化微服务应用开发与管理。为满足用户对可观测性和运维能力的更高需求,SAE引入Sidecar容器技术,实现日志采集、监控指标收集等功能扩展,且无需修改主应用代码。通过共享资源模式和独立资源模式,SAE平衡了资源灵活性与隔离性。同时,提供全链路运维能力,确保应用稳定性。未来,SAE将持续优化,支持更多场景,助力用户高效用云。
135 2
|
1月前
|
运维 监控 前端开发
Zabbix告警分析新革命:DeepSeek四大创新场景助力智能运维
面对日益复杂的IT环境,高效分析监控数据并快速响应成为运维的关键挑战。本文深入探讨了DeepSeek与Zabbix结合的创新应用,包括一键式智能告警分析、Zabbix文档知识库助手及钉钉告警增强功能。通过部署指南和实用脚本,展示了如何提升故障排查效率,为运维工程师提供高效解决方案。
239 5

相关产品

  • 云服务器 ECS
  • 下一篇
    oss创建bucket