阿里云贾少天:阿里云ECS CloudOps新能力与最佳实践分享

简介: 2022年3月22日,【全新升级 阿里云ECS CloudOps 2.0来啦!】发布会正式播出,本次发布会上阿里云宣布CloudOps(云上自动化运维)套件全新升级,并发布了CloudOps云上自动化运维白皮书2.0版本。

摘要:2022322日,【全新升级 阿里云ECS CloudOps 2.0来啦!】发布会正式播出,本次发布会上阿里云宣布CloudOps(云上自动化运维)套件全新升级,并发布了CloudOps云上自动化运维白皮书2.0版本。

 

随着本次产品的升级,阿里云推出了配套的智能化产品方案,即“ECS成熟度评估与洞察(ECS insight)”,它基于用户的ECS多维度的使用数据,从基础能力、成本管理、自动化、可靠性、弹性和安全性六个维度帮助用户分析定位潜在的运维风险,并推荐对应解决方案与最佳实践,全方位帮助企业用户降本增效,提升业务连续性。

 

阿里云弹性计算高级产品专家贾少天在本次直播中带来了题为《ECS CloudOps新能力与最佳实践》的演讲,以下是他的演讲内容整理:

 

贾少天.png


Cloudops是从自动化、弹性、成本、安全、稳定5个维度来提供能力帮助用户更好的解决日常遇到的各种问题。而这5个维度是期望通过各种各样的能力在用云的不同阶段来帮助用户,主要着力于从用云规划、架构设计到迁移上云、再到云上使用资源,最后对资源进行运维管理几个阶段让用户更高效、更精细、更智能、更开放的使用阿里云产品解决devops需求。

 

下面我就从新功能中选择几个为大家进行更进一步的介绍。


首先在规划设计阶段,第一个需要考虑的是成本问题。从成本优化角度来看,怎么做好成本管理是一个复杂且需要持续投入的过程。

 

幻灯片2.JPG

 

从第一步资源付费类型的选择开始就需要全面的考虑,了解多种付费类型的特点,选择适合自己的一种或者多种付费类型来满足业务和成本双方面的需求,同时我们推荐的最佳实践是如图,通过抢占式+按量+预付费或saving Plan购买的按量实例多种实例规格的组合来实现成本最优的效果,兼顾了稳定和弹性的多重效果。

 

然后是如何选择合适的实例规格,用户需要根据自己的场景选择最符合性能及成本要求的实例规格,阿里云最近推出了倚天710实例,在计算密集型计算场景性能更加稳定,进一步扩充了更多的选择。

 

下一步在持续使用资源的过程中,用户需要根据自身业务不同阶段的情况来判断资源负载的合理性,然后通过垂直伸缩(比如升配降配等方式),水平扩缩容、对资源进行阶段性停机降低成本等方式来进一步优化成本。

 

最后,也是最重要的一步就是持续关注成本的变化,通过阿里云提供的企业级财务能力来深入了解费用情况及合理性,然后通过循环的方式回到第一步持续优化之前的选择,只有把成本视角融入到日常流程中才能达成持续提升成本优化效果的目标。

 

幻灯片3.JPG

 

同时,在规划设计阶段,对于云上资源使用的高可用设计也需要有明确的设计,根据用户自身业务短期和长期的发展情况,选择合适的高可用设计思路来满足业务的发展需要。

 

从最基本通过部署集功能实现物理机级别的高可用,到通过弹性产品或自主编程的方式,实现多可用区级别的高可用,再到最复杂、成本相对最高且效果最好的多地域高可用,多种方式可以让不同场景的用户在设计阶段就打下了高可用的基础。

 

幻灯片4.JPG

 

当经历了规划设计阶段之后,如果用户有线下资源或者其他云厂商资源需要迁移到阿里云,阿里云也提供了“服务器迁移中心”产品,帮助用户把其他地方的服务器高效的迁移到阿里云。

 

而且在原有的服务器迁移的基础上进一步发布了4种全新的迁移能力,如支持停止维护的CentOS实例平滑迁移到Alibaba cloud linux及龙蜥系统等长期维护的系统,支持突破实例规划分布情况限制和可用区限制的跨可用区迁移ECS、支持从VMware通过agentless也就是无代理的方式免费迁移到阿里云以及从线下的笔记本、PC等快速迁移到阿里云无影云桌面的迁移能力,扩展了更多的迁移场景来满足不同用户的需求场景。

 

完成了迁移的工作,下一步我们看下帮助用户高效使用ECS资源的弹性伸缩又推出了哪些更精细更智能的功能。

 

第一,当用户面对上千种实例规格的时候,怎么更快的选择实例越来越成为一个难题,弹性伸缩基于此推出了基于规格属性的智能选型,通过定义vCPU核数、内存大小、规格族等属性,弹性伸缩就能自动帮助用户圈定一批实例规格来完成弹性场景的需求。

 

第二,发布15秒的监控指标和多指标联合的报警能力让通过负载变化的触发速度更快更精准。

 

第三,原有的ECS弹性伸缩的基础上发布了ECI弹性伸缩,让想使用容器的用户不用maintain k8s集群,最简单的使用上ECI这个兼容容器生态的实例类型。

 

第四,持续优化迭代的预测型伸缩组,让机器学习帮助用户做扩缩容的决策。它可以通过过去两天用户使用ECS资源的负载和实例数量的变化,预测未来1~14天的实例资源的使用情况。希望这些功能在各个点上能帮助用户更多的使用云的弹性。

 

幻灯片6.JPG

 

另外还有资源使用阶段可以帮助提升安全系数,降低风险的安全功能大家也可以了解下,比如阿里云提供了加密计算环境、系统盘的原声加密能力、非root账号登陆、镜像原声加密能力、加密快照等,帮助对安全合规有更高要求的用户快速的提升安全系数。

 

幻灯片7.JPG

 

再下一个阶段就是对资源的运维管理阶段了,这里我会着重为大家带来4款新的能力,提升资源运维阶段的效率,降低日常运维工作的门槛。

 

第一个是标签服务提供的创建者标签功能,用户只需要在控制台对功能进行开启,阿里云的标签服务就会完全自动的帮助用户对账号下创建的资源打上创建者标签,比如一些资源是由子账号创建的,则这些资源就会自动打上有子账号信息的标签,由主账号创建的则打上有主账号信息的标签。

 

如果是由各个云产品通过用户授权的方式帮用户创建的资源,则会打上对应云服务的标签,让用户仅通过一步操作就能从账号角度对资源进行全面的分类,特别是一个公司内多个团队通过多个子账号来创建资源的情况下,方便用户更清晰的识别出来资源的来源和归属,从而进一步通过这个标签的分组来进行分账、运维等更多操作。

 

幻灯片8.JPG

 

第二个为大家带来的运维管理新功能是云助手产品提供的“会话管理功能”,用于优化日常需要登陆到ECS机器上进行运维操作的场景。往常用户如果实现ECS资源登陆能力,要么需要设置外网IP,要么需要购置跳板机来提升安全性,然后通过跳板机进行登记,而且继续是成功登陆,后续的所有操作都无法进行方便的审计。云助手推出的会话管理功能就是为了解决这些痛点。

 

会话管理推出了免公网、免跳板机、免密码的快速登录方式,用户只需要在控制台一键开启就能使用,而且所有在资源上的操作都能保存下来进行审计,做到简化操作的同时具有审计安全的能力。

 

幻灯片9.JPG

 

第三个是我们新推出的阿里云客户端产品,很多用户反馈日常管理资源没有一个相对集中的入口,每次通过传统的ssh进行远程连接的时候,都需要先获取ECS网络信息之后再在ssh工具中进行操作,而重启等操作又要去别的地方才能完成。

 

阿里云客户端是一个集合了ssh+阿里云资源管理+简单易用+多账号管理的软件,可以下载到本地之后轻松完成对于资源的高效运维,里面也包含了前面提到的支持免密登录的会话管理功能,真正做到让每天的运维工作事半功倍。

 

幻灯片10.JPG

 

最后一个运维管理功能介绍是资源编排产品推出的Terraform托管功能,目前有很多的用户都是用Terraform来管理和使用云资源,资源编排产品在原生Terraform的基础上除了提供帮助用户执行模版能力外还提供了更多的附加能力,比如通过Terraform模版来进行资源询价和费用计算、进行资源标签或资源组的传递、多账号多地域一致性部署等能力,让很多在Terraform上无法实现的功能都能在ROS的托管能力上快速实现,帮助用户更好的使用Terraform能力。

 

幻灯片11.JPG

 

以上就是我带来的从规划设计、到迁移上云、再到资源使用以及最后的运维管理4个阶段的新功能介绍,感谢大家的观看。

 

点击链接回看精彩直播,点击链接/扫码还可阅读/下载《CloudOps云上自动化运维白皮书2.0

 

16:9封面.jpg

相关实践学习
2分钟自动化部署人生模拟器
本场景将带你借助云效流水线Flow实现人生模拟器小游戏的自动化部署
7天玩转云服务器
云服务器ECS(Elastic Compute Service)是一种弹性可伸缩的计算服务,可降低 IT 成本,提升运维效率。本课程手把手带你了解ECS、掌握基本操作、动手实操快照管理、镜像管理等。了解产品详情: https://www.aliyun.com/product/ecs
相关文章
|
20天前
|
人工智能 弹性计算 编解码
阿里云GPU云服务器性能、应用场景及收费标准和活动价格参考
GPU云服务器作为阿里云提供的一种高性能计算服务,通过结合GPU与CPU的计算能力,为用户在人工智能、高性能计算等领域提供了强大的支持。其具备覆盖范围广、超强计算能力、网络性能出色等优势,且计费方式灵活多样,能够满足不同用户的需求。目前用户购买阿里云gpu云服务器gn5 规格族(P100-16G)、gn6i 规格族(T4-16G)、gn6v 规格族(V100-16G)有优惠,本文为大家详细介绍阿里云gpu云服务器的相关性能及收费标准与最新活动价格情况,以供参考和选择。
|
25天前
|
机器学习/深度学习 人工智能 弹性计算
什么是阿里云GPU云服务器?GPU服务器优势、使用和租赁费用整理
阿里云GPU云服务器提供强大的GPU算力,适用于深度学习、科学计算、图形可视化和视频处理等多种场景。作为亚太领先的云服务提供商,阿里云的GPU云服务器具备灵活的资源配置、高安全性和易用性,支持多种计费模式,帮助企业高效应对计算密集型任务。
|
27天前
|
存储 分布式计算 固态存储
阿里云2核16G、4核32G、8核64G配置云服务器租用收费标准与活动价格参考
2核16G、8核64G、4核32G配置的云服务器处理器与内存比为1:8,这种配比的云服务器一般适用于数据分析与挖掘,Hadoop、Spark集群和数据库,缓存等内存密集型场景,因此,多为企业级用户选择。目前2核16G配置按量收费最低收费标准为0.54元/小时,按月租用标准收费标准为260.44元/1个月。4核32G配置的阿里云服务器按量收费标准最低为1.08元/小时,按月租用标准收费标准为520.88元/1个月。8核64G配置的阿里云服务器按量收费标准最低为2.17元/小时,按月租用标准收费标准为1041.77元/1个月。本文介绍这些配置的最新租用收费标准与活动价格情况,以供参考。
|
25天前
|
机器学习/深度学习 人工智能 弹性计算
阿里云GPU服务器全解析_GPU价格收费标准_GPU优势和使用说明
阿里云GPU云服务器提供强大的GPU算力,适用于深度学习、科学计算、图形可视化和视频处理等场景。作为亚太领先的云服务商,阿里云GPU云服务器具备高灵活性、易用性、容灾备份、安全性和成本效益,支持多种实例规格,满足不同业务需求。
157 2
|
29天前
|
监控 Ubuntu Linux
使用VSCode通过SSH远程登录阿里云Linux服务器异常崩溃
通过 VSCode 的 Remote - SSH 插件远程连接阿里云 Ubuntu 22 服务器时,会因高 CPU 使用率导致连接断开。经排查发现,VSCode 连接根目录 ".." 时会频繁调用"rg"(ripgrep)进行文件搜索,导致 CPU 负载过高。解决方法是将连接目录改为"root"(或其他具体的路径),避免不必要的文件检索,从而恢复正常连接。
|
弹性计算 运维 监控
学生使用阿里云ECS的最佳实践
通过飞天加速计划获取的半个月的ECS,对基础的ECS使用做出总结。交个作业 通过本你会学会以下几点: • 配置和连接新的ECS服务器 • 配置安全组释放端口 • 使用宝塔工具对服务器进行管理 • 使用宝塔wordpress博客系统 • 使用wordpress搭建个人博客
|
2月前
|
弹性计算 网络安全
阿里云国际OpenAPI多接口快速管理ECS服务器教程
阿里云国际OpenAPI多接口快速管理ECS服务器教程
|
1月前
|
弹性计算
阿里云2核16G服务器多少钱一年?亲测价格查询1个月和1小时收费标准
阿里云2核16G服务器提供多种ECS实例规格,内存型r8i实例1年6折优惠价为1901元,按月收费334.19元,按小时收费0.696221元。更多规格及详细报价请访问阿里云ECS页面。
67 9
|
1月前
|
弹性计算 异构计算
2024年阿里云GPU服务器多少钱1小时?亲测价格查询方法
2024年阿里云GPU服务器每小时收费因实例规格不同而异。可通过阿里云GPU服务器页面选择“按量付费”查看具体价格。例如,NVIDIA A100的gn7e实例为34.742元/小时,NVIDIA A10的gn7i实例为12.710156元/小时。更多详情请访问阿里云官网。
94 2
|
1月前
|
存储 弹性计算 NoSQL
"从入门到实践,全方位解析云服务器ECS的秘密——手把手教你轻松驾驭阿里云的强大计算力!"
【10月更文挑战第23天】云服务器ECS(Elastic Compute Service)是阿里云提供的基础云计算服务,允许用户在云端租用和管理虚拟服务器。ECS具有弹性伸缩、按需付费、简单易用等特点,适用于网站托管、数据库部署、大数据分析等多种场景。本文介绍ECS的基本概念、使用场景及快速上手指南。
77 3

热门文章

最新文章

相关产品

  • 云服务器 ECS