带你读《云上自动化运维宝典》——ECS省钱指南来啦!万字长文教你如何选择与业务形态最匹配的付费方式(2)

简介: 带你读《云上自动化运维宝典》——ECS省钱指南来啦!万字长文教你如何选择与业务形态最匹配的付费方式(2)

更多精彩内容,欢迎观看:

带你读《云上自动化运维宝典》——ECS省钱指南来啦!万字长文教你如何选择与业务形态最匹配的付费方式(1):https://developer.aliyun.com/article/1405383


下面重点介绍一下节省计划和预留实例券的区别。

 

节省计划具有更好的灵活性,支持多规格族、多地域部署场景下资源账单抵扣需求。节省计划真正做到了财务和资源的解耦,不再和资源使用的台数做绑定。预留实例券只能抵扣计算规格的账单,而节省计划可以抵扣计算、系统盘、数据盘和固定带宽的账单,但不同的计费项的折扣力度不同。

 

节省计划相比预留实例券可以简化对账,节省计划还支持多种产品,比如ECSECIRDS,未来还将支持更多的云产品。节省计划不支持按月最低购买时长为一年,而预留实例券支持按月购买。

 

image.png

 

节省计划分为通用型和ECS计算型。

 

通用型节省计划具有更大的灵活性,支持地域级灵活性和规格族级灵活性。简单的说就是我购买一份通用型的节省计划,可以覆盖全地域、全规格的ECS资源。

 

ECS计算型节省计划只能覆盖特定地域下,特定规格族的ECS资源。在购买的时候,我们就需要指定地域和指定规格族。但计算型节省计划可以提供更低的折扣,等于牺牲了灵活性换取到了更好的经济性。

 

image.png

 

下面我们来看一下节省计划的应用场景。

 

第一个场景,多规格资源的弹性业务。比如在之前预留实例券应用场景里提到的弹性场景,如果弹性业务集群使用了多规格族的资源,使用预留实例券就很难做到全面的覆盖。而节省计划可以覆盖不同的规格,这种场景下就推荐使用节省计划+按量付费的方式。通过对业务资源的预估,计算每小时承诺消费金额,购买对应的节省计划降低资源的成本。

 

第二个场景,弹性升降配。对算力存在变化,需要通过升降配调整机器资源配置的场景,如果使用包年包月的实例,会存在两个问题,第一个是实例的生命周期维护比较复杂,第二个是在升降配退款上会产生隐形成本。使用节省计划+按量付费的方式,利用节省计划支持规格灵活性的特点,可以随时的调整资源配置。

 

第三个场景,混合部署。适合同时有多个业务上云的场景,不同的业务在不同时间段使用的资源数量不同,比如白天的业务们使用大量的机器提供在线服务,晚上大数据部门使用机器资源做数据处理。这两部分的业务使用的机器规格不同,使用包年包月的实例,各业务都有一半的时间存在资源浪费。而使用节省计划+按量付费的方式,对多个业务的资源进行整体抵扣,可以实现跨规格的折扣权益共享。

 

image.png

 

接下来整体比较一下各个付费方式。

 

∙        从经济性方面,最优的是抢占式实例,它最低可以提供按量付费一折起的费用,其次是包年包月和预留实例券。预留实例券通常可以提供和包年包月相同的折扣力度,购买一年的费用相比按量付费可以做到5.6折。再往后分别是ECS计算型节省计划和通用型节省计划,购买一年的费用相比按量付费分别可以做到6.1折和七折。

∙        从折扣项来看,包年包月和节省计划可以抵扣计算、系统盘、数据盘、固定带宽的费用。抢占式实例和预留实例券抵扣的都是计算规格的费用,但计算规格在整体资源的费用中占比比较高,通常占比在80%~90。如果使用预留实例券,还可以搭配存储容量单位包SCU来抵扣云盘的费用。

∙        在灵活性方面,和经济性相反,从高到低依次是通用型节省计划、计算型节省计划、地域级预留实例券、可用区级预留实例券。通用级节省计划具有最高的灵活性,支持跨规格族、跨可用区、跨地域的灵活性。在选择抵扣类产品的时候,可以根据资源的分布情况,以及需要支持的灵活性选择合适的抵扣类产品。

∙        在确定性方面,包年包月和可用区级的预留实例券的确定性相对较高,而地域级预留实例券、ECS计算型节省计划、通用型节省计划,需要搭配容量预定来提升确定性。

 

image.png

 

下面我们来看一下具体的场景推荐,这里我列举了一些业务场景做付费方式选型的推荐,大家在选型的时候可以参考。

 

我把业务场景分为弹性业务和稳态业务。对于弹性业务,如果是无状态的,容错能力强的,比如科学计算、图像处理等等。这些场景对于算力要求较高,且算力存在波峰波谷,弹性需求也较高。强烈推荐使用抢占式实例可以极大的降低算力成本。

 

对于临时性的弹性业务不能中断的,推荐使用按量付费实例来支撑业务。典型的场景比如电商大促、突发热点带来的突增流量。在流量突增的时候,我们可以通过扩容按量付费实例来提供服务,等流量慢慢过去以后再去释放扩容掉的这部分机器。因为按量付费实例是按秒计费的,所以我们只需要承担扩容期间的这部分费用。

 

对于长期的弹性业务,比如游戏、互联网应用,算力需求本身是随着流量波动的,所以推荐使用按量付费+节省计划,按量付费实例用来支撑算力波动的灵活性,随时扩容和缩容,节省计划用来对按量实例进行抵扣,降低资源成本。

 

对于稳态的业务,如果是固定资源且长期稳定的业务,典型的有OACRM系统,数据库服务对灵活性要求相对较低,推荐使用包年包月。对于固定规格族的长期业务,比如DevOps,有多套环境使用的都是相同规格的配置,推荐使用按量付费+预留实例券。对于多种环境的混合部署,比如在线业务和离线业务同时上云的场景,不同的业务使用的机器规格不同,我们推荐使用按量付费+节省计划的方式。

 

image.png

 

在实际的使用中,可以根据业务场景组合多种付费方式完成业务支撑。对于稳定的业务负载,使用包年包月实例或者按量付费+抵扣类产品来支撑。对于突发型的业务负载,无状态任务型的使用抢占式实例,有状态、不能中断的,选用按量付费实例。

2) 选取合适的资源规格

 

image.png

 

首先看一下ECS的产品分类。ECS实例分为通用计算、异构计算、高性能计算。通用计算是ECS实例最常用的实例类型,适用于一般性的应用和服务器,提供了丰富的配置选择。支持垂直类场景增强型实例,比如网络增强型、存储增强型、内存增强型、安全增强型等等。

 

异构计算是指使用不同类型指令集和体系架构的计算单元组成系统的计算方式。目前包括GPU云服务器、FPGA云服务器、弹性加速计算实例等等。异构计算通过让最合适的专用硬件做最合适的事来调节能耗,从而达到性能和成本最优化。

 

image.png

 

根据场景来选择合适的规格,可以获得最优的性价比。

 

∙        对于网站服务器、中间件,推荐使用通用计算实例和高主频实例。

∙        对于大数据分析、分布式文件系统、数据库等,推荐使用存储型增强实例、大数据实例。

∙        对于内存数据库,推荐使用内存增强型实例。

∙        对于网关、网源、防火墙推荐使用网络增强型实例。

∙        对于科学计算、视频编解码、图像渲染等,推荐使用GPU云服务器。

 

从产品的维度来看,通用计算实例可以覆盖最多的业务场景。

 

image.png

下面再来介绍一下通用计算实例的选型。

 

七代主售实例(g7c7r7),它具有最优的性能比,覆盖场景全面,是上云的第一选择。在今年5月,我们对七代主售实例价格再次进行下调,七代全部规格下调15%~20%,性能比优势再次提升。七代主售实例适合绝大多数通用场景,比如web应用、中间件、数据库、数据分析、科学计算等等。

 

倚天八代实例(g8yc8yr8y),它在2022年正式发布,采用基于ARM的自研倚天710芯片。倚天八代实例具有独享物理核,算力会更强劲。在多任务、高负荷场景,倚天的性能线性度表现更好,支持高负载运行。它适合计算密集型场景,比如web应用、视频编解码、高性能计算、AI推理等等。

 

通用算力型U实例,它是面向中小企业用户的企业级独享实例,和七代主售实例相比,相同算力购置成本更低。如果对于CPUIO性能要求不高,希望进一步降低资源成本的,可以考虑使用通用算力U实例。它适用于对性能要求不高的场景,比如轻量级网站应用、离线数据分析、企业办公应用、中小型数据库等等。

 

性能突发实例T系列,它针对的是企业及个人用户持续低性能或者偶尔有突发性能需求的场景来设计。可以利用CPU控制基准性能满足一些突发性能的需求。主要面向入门级场景,最小实例规格是1c0.5g。如果对性能要求不高,希望以最低成本购置云上资源的,可以考虑使用性能突发实例T系列。适合的场景有轻量级应用、开发测试。


3) 提升资源利用率

 

image.png

 

在提升资源利用率方面,我总结了三部分优化内容。

 

第一,资源使用率优化。常见的方法有释放闲置的资源、降配低负载资源、升配高负载资源、弹性扩缩容等等。通常我们可以借助资源监控工具发现优化机会,并结合业务特性、性能、成本等综合考虑后来执行。

 

第二,抵扣产品覆盖率优化。需要关注预留实例券、节省计划的使用率和覆盖率。节省计划的使用率是用于查看节省计划的使用情况,使用率是指购买节省计划后有多少比例参与了抵扣,使用率越高说明节省计划的使用效果越好。节省计划的覆盖率是用来衡量按量费用的资源有多少费用被节省计划进行抵扣了,覆盖率越高说明这些按量资源的成本被节省计划很好的抵扣。

 

我们追求的是使用率高、覆盖率高的场景,这是最优的场景说明节省计划很好的帮助我们降低了资源成本。如果出现使用率高,覆盖率低,说明我们的节省计划可能买少了,还有很多的按量资源没能被节省计划抵扣。如果是使用率低,覆盖率高,说明我们的节省计划可能买多了,有节省计划闲置浪费了。如果是使用率低,覆盖率低,有可能是我们的节省计划买错了,节省计划和按量实例没有能够匹配上。

 

因此阿里云还提供了节省计划、购买推荐、下月预测等功能,可以帮助我们优化折扣产品。在购买推荐页面,我们可以输入节省计划的类型、购买时长、付费类型,系统会根据过往的实例账单自动推荐每小时的承诺消费金额,并且给出预期节省幅度以供参考。下月预测可以查看预估未来一个月对应云产品节省计划的使用情况,以及优化建议内容与方案。

 

第三,架构优化。在保障应用稳定性的前提下,通过优化架构升级能够在更大的范围内去降低整体云服务的使用成本。常见的架构优化策略有,通过架构全面云原生化组建成本最优的云服务使用模式,还有通过离在线混步技术,提升整资源的整体利用率,降低成本。还有通过Serverless化架构提升应用研发效率,收获良好的成本效益。

 

image.png

 

这里是我总结的一些其他降本增效的方法。

 

∙        对于抢占式实例,可以借助弹性供应、弹性伸缩产品实现算力集群的稳定交付。具体弹性伸缩的内容,后面会做更详细的讲解。

∙        对于按量付费实例,如果没有使用又不想立即释放的,可以开启节省停机模式。也可以借助自动化运维工具,OOS实现周期性的定时开关机。

∙        对于包年包月实例,可以通过开启自动续费,统一到期日等,简化生命周期的维护。如果包年包月实例不再使用,也可以退订或者转按量付费。此外,还可以借助我们的成本优化工具,授权智能顾问产品定期扫描自身资源,给出成本优化的建议,借助用户中心成本分析功能进行费用分析与优化。

4) 客户案例

 

image.png

 

下面来看两个在成本优化方面的客户案例。

 

第一个客户案例来自于深势科技。它是一家药物研发算法科技公司,致力于通过技术解决药物研发的难题,实现药物分子的理性发现和设计。

 

客户上云的痛点主要有以下三个:

 

∙        业务波动量比较大,希望可以提供基于作业负载的弹性伸缩能力,最大化的利用计算资源。

∙        希望有效的调度集群的计算资源,能够提供跨可用区、多规格实例的弹性扩容。

∙        作为一家初创企业,追求高性价比,希望能够以较低的成本完成有效的计算。

 

客户的痛点主要集中在算力需求、灵活性、成本三方面。在资源规格方面,推荐使用GPU服务器GN7,使得模型训练和推理的效率提升2-6倍。在成本和灵活性方面,使用了弹性供应的成本最优调度策略来调度抢占式实例。指定多个可用区和实例规格,确保以最优的价格完成抢占式资源的交付,最终以30%的成本完成日均3w+ vCPU资源的交付。

 

image.png

第二个客户案例来自于汇量科技。它是一家全球应用开发者技术服务平台,专注于提供移动互联网广告和数据分析服务。

 

客户的痛点主要有以下两点:

 

∙        降本和技术需求,广告投放业务每日所需要的云成本资源波动巨大,是典型的弹性场景。

∙        性能需求,广告推理服务金牌模块对于算力需求比较高。

我们的解决方案是在资源规格方面使用了第八代倚天云实例g8y,实现了同时提升CPU性能和内网带宽。与g6系列对比,单机成本降低15%-20%,综合性价比提升了30%以上。

 

通过结合ESS弹性伸缩服务和抢占式实例产品,在高峰期时及时开放资源,在低峰期时缩减资源。保障资源使用率在一个合理的水平,从而确保了成本的最优化。稳态的业务从包年包月转成按量+节省计划的购买形式,在成本进一步优化的同时,业务的灵活性也得到了很大的保障。


更多精彩内容,欢迎观看:

带你读《云上自动化运维宝典》——ECS省钱指南来啦!万字长文教你如何选择与业务形态最匹配的付费方式(3):https://developer.aliyun.com/article/1405381

相关实践学习
通义万相文本绘图与人像美化
本解决方案展示了如何利用自研的通义万相AIGC技术在Web服务中实现先进的图像生成。
7天玩转云服务器
云服务器ECS(Elastic Compute Service)是一种弹性可伸缩的计算服务,可降低 IT 成本,提升运维效率。本课程手把手带你了解ECS、掌握基本操作、动手实操快照管理、镜像管理等。了解产品详情: https://www.aliyun.com/product/ecs
相关文章
|
4月前
|
弹性计算 Devops Shell
用阿里云 DevOps Flow 实现 ECS 部署自动化:从准备到落地的完整指南
阿里云 DevOps Flow 是一款助力开发者实现自动化部署的高效工具,支持代码流水线构建、测试与部署至ECS实例,显著提升交付效率与稳定性。本文详解如何通过 Flow 自动部署 Bash 脚本至 ECS,涵盖环境准备、流水线搭建、源码接入、部署流程设计及结果验证,助你快速上手云上自动化运维。
402 0
|
5月前
|
运维 Prometheus 监控
3 年部署经验总结:用自动化工具轻松管理 300+ 服务器开源软件
三年前接手公司IT部门时,我满怀信心,却发现部署效率低下。尽管使用了GitLab、Jenkins、Zabbix等100+开源工具,部署仍耗时费力。文档厚重如百科,却难解实际困境。一次凌晨三点的加班让我下定决心改变现状。偶然看到一篇国外博客,介绍了自动化部署的高效方式,我深受启发。
249 0
|
3月前
|
弹性计算 定位技术 数据中心
阿里云服务器配置选择方法:付费类型、地域及CPU内存配置全解析
阿里云服务器怎么选?2025最新指南:就近选择地域,降低延迟;长期使用选包年包月,短期灵活选按量付费;企业选2核4G5M仅199元/年,个人选2核2G3M低至99元/年,高性价比爆款推荐,轻松上云。
227 11
|
3月前
|
弹性计算 人工智能 前端开发
在阿里云ECS上部署n8n自动化工作流:U2实例实战
本文介绍如何在阿里云ECS的u2i/u2a实例上部署开源工作流自动化平台n8n,利用Docker快速搭建并配置定时任务,实现如每日抓取MuleRun新AI Agent并推送通知等自动化流程。内容涵盖环境准备、安全组设置、实战案例与优化建议,助力高效构建低维护成本的自动化系统。
905 5
|
4月前
|
弹性计算 定位技术 数据中心
阿里云服务器选择方法:配置、地域及付费模式全解析
2025阿里云服务器选购指南:就近选择地域以降低延迟,企业用户优选2核4G5M带宽u1实例,仅199元/年;个人用户可选2核2G3M带宽ECS,99元/年起。长期稳定业务选包年包月,短期或波动场景用按量付费,轻松搭建网站首选高性价比配置。
|
6月前
|
运维 前端开发 JavaScript
半夜服务器告警不再错过!运维人员必备的语音通知方案
为解决深夜服务器宕机错过告警的问题,本文介绍一款专为个人开发者与运维人员设计的语音通知方案。通过电话直接推送重要告警,确保第一时间响应,避免故障扩大。支持多种编程语言调用,配置简单,3步即可完成,实时性强,适合各类关键业务场景。
594 5
|
5月前
|
弹性计算 运维 分布式计算
阿里云服务器付费模式选择:节省计划、预留实例券、抢占式实例详解
在我们选购阿里云服务器的时候,有多种计费方式可选,其中包年包月和按量付费是用户最熟悉也是选择最多的计费方式,除了这两种方式之外,阿里云还提供了抢占式实例、节省计划、预留实例券三种更为灵活且经济的付费模式,旨在满足不同业务场景下的长周期低成本与短周期高弹性需求,有的新手用户朋友不清楚这三种计费方式是什么,本文将为大家解析这三种付费模式的内在机制、优势对比及适用场景,以供您选择参考。
|
5月前
|
运维 监控 安全
“没服务器了,那我这运维是白干了吗?”——无服务器架构对运维的冲击与转机
“没服务器了,那我这运维是白干了吗?”——无服务器架构对运维的冲击与转机
150 0
|
6月前
|
运维 Prometheus 监控
“服务器又宕了?”别急,智能运维教你如何未卜先知!
“服务器又宕了?”别急,智能运维教你如何未卜先知!
183 0

热门文章

最新文章

相关产品

  • 云服务器 ECS