阿里云贾少天:阿里云ECS CloudOps新能力与最佳实践分享

本文涉及的产品
轻量应用服务器 2vCPU 1GiB,适用于搭建电商独立站
轻量应用服务器 2vCPU 4GiB,适用于搭建Web应用/小程序
轻量应用服务器 4vCPU 16GiB,适用于搭建游戏自建服
简介: 2022年3月22日,【全新升级 阿里云ECS CloudOps 2.0来啦!】发布会正式播出,本次发布会上阿里云宣布CloudOps(云上自动化运维)套件全新升级,并发布了CloudOps云上自动化运维白皮书2.0版本。

摘要:2022322日,【全新升级 阿里云ECS CloudOps 2.0来啦!】发布会正式播出,本次发布会上阿里云宣布CloudOps(云上自动化运维)套件全新升级,并发布了CloudOps云上自动化运维白皮书2.0版本。

 

随着本次产品的升级,阿里云推出了配套的智能化产品方案,即“ECS成熟度评估与洞察(ECS insight)”,它基于用户的ECS多维度的使用数据,从基础能力、成本管理、自动化、可靠性、弹性和安全性六个维度帮助用户分析定位潜在的运维风险,并推荐对应解决方案与最佳实践,全方位帮助企业用户降本增效,提升业务连续性。

 

阿里云弹性计算高级产品专家贾少天在本次直播中带来了题为《ECS CloudOps新能力与最佳实践》的演讲,以下是他的演讲内容整理:

 

贾少天.png


Cloudops是从自动化、弹性、成本、安全、稳定5个维度来提供能力帮助用户更好的解决日常遇到的各种问题。而这5个维度是期望通过各种各样的能力在用云的不同阶段来帮助用户,主要着力于从用云规划、架构设计到迁移上云、再到云上使用资源,最后对资源进行运维管理几个阶段让用户更高效、更精细、更智能、更开放的使用阿里云产品解决devops需求。

 

下面我就从新功能中选择几个为大家进行更进一步的介绍。


首先在规划设计阶段,第一个需要考虑的是成本问题。从成本优化角度来看,怎么做好成本管理是一个复杂且需要持续投入的过程。

 

幻灯片2.JPG

 

从第一步资源付费类型的选择开始就需要全面的考虑,了解多种付费类型的特点,选择适合自己的一种或者多种付费类型来满足业务和成本双方面的需求,同时我们推荐的最佳实践是如图,通过抢占式+按量+预付费或saving Plan购买的按量实例多种实例规格的组合来实现成本最优的效果,兼顾了稳定和弹性的多重效果。

 

然后是如何选择合适的实例规格,用户需要根据自己的场景选择最符合性能及成本要求的实例规格,阿里云最近推出了倚天710实例,在计算密集型计算场景性能更加稳定,进一步扩充了更多的选择。

 

下一步在持续使用资源的过程中,用户需要根据自身业务不同阶段的情况来判断资源负载的合理性,然后通过垂直伸缩(比如升配降配等方式),水平扩缩容、对资源进行阶段性停机降低成本等方式来进一步优化成本。

 

最后,也是最重要的一步就是持续关注成本的变化,通过阿里云提供的企业级财务能力来深入了解费用情况及合理性,然后通过循环的方式回到第一步持续优化之前的选择,只有把成本视角融入到日常流程中才能达成持续提升成本优化效果的目标。

 

幻灯片3.JPG

 

同时,在规划设计阶段,对于云上资源使用的高可用设计也需要有明确的设计,根据用户自身业务短期和长期的发展情况,选择合适的高可用设计思路来满足业务的发展需要。

 

从最基本通过部署集功能实现物理机级别的高可用,到通过弹性产品或自主编程的方式,实现多可用区级别的高可用,再到最复杂、成本相对最高且效果最好的多地域高可用,多种方式可以让不同场景的用户在设计阶段就打下了高可用的基础。

 

幻灯片4.JPG

 

当经历了规划设计阶段之后,如果用户有线下资源或者其他云厂商资源需要迁移到阿里云,阿里云也提供了“服务器迁移中心”产品,帮助用户把其他地方的服务器高效的迁移到阿里云。

 

而且在原有的服务器迁移的基础上进一步发布了4种全新的迁移能力,如支持停止维护的CentOS实例平滑迁移到Alibaba cloud linux及龙蜥系统等长期维护的系统,支持突破实例规划分布情况限制和可用区限制的跨可用区迁移ECS、支持从VMware通过agentless也就是无代理的方式免费迁移到阿里云以及从线下的笔记本、PC等快速迁移到阿里云无影云桌面的迁移能力,扩展了更多的迁移场景来满足不同用户的需求场景。

 

完成了迁移的工作,下一步我们看下帮助用户高效使用ECS资源的弹性伸缩又推出了哪些更精细更智能的功能。

 

第一,当用户面对上千种实例规格的时候,怎么更快的选择实例越来越成为一个难题,弹性伸缩基于此推出了基于规格属性的智能选型,通过定义vCPU核数、内存大小、规格族等属性,弹性伸缩就能自动帮助用户圈定一批实例规格来完成弹性场景的需求。

 

第二,发布15秒的监控指标和多指标联合的报警能力让通过负载变化的触发速度更快更精准。

 

第三,原有的ECS弹性伸缩的基础上发布了ECI弹性伸缩,让想使用容器的用户不用maintain k8s集群,最简单的使用上ECI这个兼容容器生态的实例类型。

 

第四,持续优化迭代的预测型伸缩组,让机器学习帮助用户做扩缩容的决策。它可以通过过去两天用户使用ECS资源的负载和实例数量的变化,预测未来1~14天的实例资源的使用情况。希望这些功能在各个点上能帮助用户更多的使用云的弹性。

 

幻灯片6.JPG

 

另外还有资源使用阶段可以帮助提升安全系数,降低风险的安全功能大家也可以了解下,比如阿里云提供了加密计算环境、系统盘的原声加密能力、非root账号登陆、镜像原声加密能力、加密快照等,帮助对安全合规有更高要求的用户快速的提升安全系数。

 

幻灯片7.JPG

 

再下一个阶段就是对资源的运维管理阶段了,这里我会着重为大家带来4款新的能力,提升资源运维阶段的效率,降低日常运维工作的门槛。

 

第一个是标签服务提供的创建者标签功能,用户只需要在控制台对功能进行开启,阿里云的标签服务就会完全自动的帮助用户对账号下创建的资源打上创建者标签,比如一些资源是由子账号创建的,则这些资源就会自动打上有子账号信息的标签,由主账号创建的则打上有主账号信息的标签。

 

如果是由各个云产品通过用户授权的方式帮用户创建的资源,则会打上对应云服务的标签,让用户仅通过一步操作就能从账号角度对资源进行全面的分类,特别是一个公司内多个团队通过多个子账号来创建资源的情况下,方便用户更清晰的识别出来资源的来源和归属,从而进一步通过这个标签的分组来进行分账、运维等更多操作。

 

幻灯片8.JPG

 

第二个为大家带来的运维管理新功能是云助手产品提供的“会话管理功能”,用于优化日常需要登陆到ECS机器上进行运维操作的场景。往常用户如果实现ECS资源登陆能力,要么需要设置外网IP,要么需要购置跳板机来提升安全性,然后通过跳板机进行登记,而且继续是成功登陆,后续的所有操作都无法进行方便的审计。云助手推出的会话管理功能就是为了解决这些痛点。

 

会话管理推出了免公网、免跳板机、免密码的快速登录方式,用户只需要在控制台一键开启就能使用,而且所有在资源上的操作都能保存下来进行审计,做到简化操作的同时具有审计安全的能力。

 

幻灯片9.JPG

 

第三个是我们新推出的阿里云客户端产品,很多用户反馈日常管理资源没有一个相对集中的入口,每次通过传统的ssh进行远程连接的时候,都需要先获取ECS网络信息之后再在ssh工具中进行操作,而重启等操作又要去别的地方才能完成。

 

阿里云客户端是一个集合了ssh+阿里云资源管理+简单易用+多账号管理的软件,可以下载到本地之后轻松完成对于资源的高效运维,里面也包含了前面提到的支持免密登录的会话管理功能,真正做到让每天的运维工作事半功倍。

 

幻灯片10.JPG

 

最后一个运维管理功能介绍是资源编排产品推出的Terraform托管功能,目前有很多的用户都是用Terraform来管理和使用云资源,资源编排产品在原生Terraform的基础上除了提供帮助用户执行模版能力外还提供了更多的附加能力,比如通过Terraform模版来进行资源询价和费用计算、进行资源标签或资源组的传递、多账号多地域一致性部署等能力,让很多在Terraform上无法实现的功能都能在ROS的托管能力上快速实现,帮助用户更好的使用Terraform能力。

 

幻灯片11.JPG

 

以上就是我带来的从规划设计、到迁移上云、再到资源使用以及最后的运维管理4个阶段的新功能介绍,感谢大家的观看。

 

点击链接回看精彩直播,点击链接/扫码还可阅读/下载《CloudOps云上自动化运维白皮书2.0

 

16:9封面.jpg

相关实践学习
快速体验PolarDB开源数据库
本实验环境已内置PostgreSQL数据库以及PolarDB开源数据库:PolarDB PostgreSQL版和PolarDB分布式版,支持一键拉起使用,方便各位开发者学习使用。
7天玩转云服务器
云服务器ECS(Elastic Compute Service)是一种弹性可伸缩的计算服务,可降低 IT 成本,提升运维效率。本课程手把手带你了解ECS、掌握基本操作、动手实操快照管理、镜像管理等。了解产品详情: https://www.aliyun.com/product/ecs
目录
打赏
0
6
3
2
3501
分享
相关文章
DeepSeek服务器繁忙解决方法:使用阿里云一键部署DeepSeek个人网站!
通过阿里云一键部署DeepSeek个人网站,解决服务器繁忙问题。学生用户可领取300元代金券实现0成本部署,普通用户则可用99元/年的服务器。教程涵盖从选择套餐、设置密码到获取百炼API-KEY的全流程,助您快速搭建专属大模型主页,体验DeepSeek、Qwen-max、Llama等多款模型,无需代码,最快5分钟完成部署。支持绑定个人域名,共享亲友使用,日均成本仅约1元。
75 10
玩转云服务器——阿里云操作系统控制台体验测评
在云服务器日益普及的背景下,运维人员对操作系统管理工具的要求不断提高。我们需要一款既能直观展示系统状态,又能智能诊断问题,提供专业指导的控制台。阿里云操作系统管理平台正是基于API、SDK、CLI等多种管理方式,致力于提升操作效率,为用户带来全新的系统运维体验。阿里云操作系统控制台凭借便捷易用的设计和高效的管理功能,成为云服务器运维的强力助手。本次测评基于真实体验截图,对其整体表现进行了深入探索。
89 33
阿里云特惠云服务器99元与199元配置与性能和适用场景解析:高性价比之选
2025年,阿里云长效特惠活动继续推出两款极具吸引力的特惠云服务器套餐:99元1年的经济型e实例2核2G云服务器和199元1年的通用算力型u1实例2核4G云服务器。这两款云服务器不仅价格亲民,而且性能稳定可靠,为入门级用户和普通企业级用户提供了理想的选择。本文将对这两款云服务器进行深度剖析,包括配置介绍、实例规格、使用场景、性能表现以及购买策略等方面,帮助用户更好地了解这两款云服务器,以供参考和选择。
深度体验阿里云系统控制台:SysOM 让 Linux 服务器监控变得如此简单
作为一名经历过无数个凌晨三点被服务器报警电话惊醒的运维工程师,我对监控工具有着近乎苛刻的要求。记得去年那次大型活动,我们的主站流量暴增,服务器内存莫名其妙地飙升到90%以上,却找不到原因。如果当时有一款像阿里云 SysOM 这样直观的监控工具,也许我就不用熬通宵排查问题了。今天,我想分享一下我使用 SysOM 的亲身体验,特别是它那令人印象深刻的内存诊断功能。
幻兽帕鲁palworld自建游戏联机服务器,使用阿里云价格真优惠!
阿里云提供幻兽帕鲁(Palworld)游戏服务器搭建服务,支持4核16G(8人在线)和8核32G(20人在线)两种配置,带宽10M,价格低至70元/月起。通过阿里云计算巢服务,可实现一键购买与自动部署,简单快捷。玩家只需在本地安装STEAM客户端并登录游戏,输入服务器IP及端口8211即可联机游玩。教程详细涵盖服务器选择、配置设置及游戏接入全流程,助你轻松开启帕鲁冒险之旅!
2025年阿里云GPU服务器租用价格、选型策略与应用场景详解
随着AI与高性能计算需求的增长,阿里云提供了多种GPU实例,如NVIDIA V100、A10、T4等,适配不同场景。2025年重点实例中,V100实例GN6v单月3830元起,适合大规模训练;A10实例GN7i单月3213.99元起,适用于混合负载。计费模式有按量付费和包年包月,后者成本更低。针对AI训练、图形渲染及轻量级推理等场景,推荐不同配置以优化成本和性能。阿里云还提供抢占式实例、ESSD云盘等资源优化策略,支持eRDMA网络加速和倚天ARM架构,助力企业在2025年实现智能计算的效率与成本最优平衡。 (该简介为原文内容的高度概括,符合要求的字符限制。)
【阿里云】控制台使用指南:从创建ECS到系统诊断测评
本文介绍了如何通过阿里云获取ECS云服务器并进行操作系统配置与组件安装,以实现高效的资源管理和系统监控。阿里云凭借强大的基础设施和丰富的服务成为用户首选。文中详细描述了获取ECS、RAM授权、开通操作系统控制台及组件安装的步骤,并展示了如何利用控制台实时监控性能指标、诊断系统问题及优化性能。特别针对idle进程进行了深入分析,提出了优化建议。最后,建议定期进行系统健康检查,并希望阿里云能推出更友好的低成本套餐,满足学生等群体的需求。
89 17
【阿里云】控制台使用指南:从创建ECS到系统诊断测评
阿里云幻兽帕鲁联机服务器搭建全攻略,速来抄作业!2025新版教程
阿里云提供2025年最新幻兽帕鲁服务器申请购买及一键开服教程。4核16G配置支持8人,70元/月;8核32G配置支持20人,160元/月。选择配置、地域、操作系统后,点击【一键购买及部署】,约3分钟完成创建。本地安装STEAM客户端并登录,进入游戏选择多人模式,输入服务器IP和端口(8211),即可开始游戏。详细教程及更多问题解答请参考阿里云幻兽帕鲁游戏专区。
69 20
阿里云操作系统控制台——解决服务器磁盘I/O故障
阿里云操作系统控制台——解决服务器磁盘I/O故障
45 12
阿里云操作系统控制台——ECS操作与性能优化
本文详细介绍如何操作阿里云服务器ECS,从开通到组件安装及内存诊断。首先,通过选择操作系统(如Alibaba Cloud Linux 3)并开通服务,创建RAM用户并授予权限。接着,安装所需组件,支持节点或集群安装。最后,利用内存全景诊断功能,输入实例ID或Pod名称发起诊断并解析结果。这一流程帮助用户高效搭建计算环境,提升技术能力,确保业务稳定运行,并提出优化建议以改善用户体验。
89 8

热门文章

最新文章

相关产品

  • 云服务器 ECS
  • AI助理

    你好,我是AI助理

    可以解答问题、推荐解决方案等