闲置计费 | Serverless 冷启动与成本间的最优解

简介: 函数计算闲置计费功能的发布,帮助用户进一步降低使用预留实例的成本,可以让用户只为真实使用的预留资源付费。

作者 | 阿里云 Serverless 高级开发工程师 萧起


听说你也做过这样的技术选型

小王是一名程序员,公司的应用是跑在自建机房的服务器上,所有的底层服务和运维都需要自己亲自下手来做,每次升级、机器扩容都带来比较大的运维压力,同时为了能及时扩容堆了不少闲置的机器,机器成本一直比较高。最近公司新开发了两个应用系统,小王在做技术选型,打算拥抱云计算,把新应用部署在云上,设计一套高弹性、低成本、运维简单,能轻松应对业务突发流量上涨的架构方案,让自己可以把更多精力投入到业务开发中,减轻自己的运维负担。


这两个应用有几个共同的特点:

  • 两个应用都属于在线应用,对调用延迟、服务稳定性有比较高的要求
  • 应用流量随业务变化比较大,而且很难提前预估业务量会上涨多少,对弹性有比较高的要求。
  • 有明显的业务低峰期,低峰期调用量比较低,预计低峰期主要集中于晚上。
  • 应用启动时间长:一个是 Java SpringBoot 的订单系统,一个是基于大规格镜像的 AI 图片识别系统,启动时间将近1分钟。


小王的需求总结起来有三个:

  • 一是希望在运维上省事省心,交付 jar 包或者镜像后,只需简单的配置应用就能运行起来,不用专门花费精力搞运维、监控、告警。
  • 二是弹性能力要好,业务流量上涨时,可以自动地及时扩容,流量下降后,再自动缩容。
  • 三是通过使用云计算,提高资源利用率,在成本上更有优势。


下面就拆开看小王是如何一步一步进行技术选型的。


服务高度集成,免运维,高弹性

在做技术选型时,小王考虑过三种技术架构:SLB+云服务器+弹性伸缩的传统架构、K8s 架构、函数计算 (FC )架构。

传统架构需要自己搞 SLB 负载均衡;配置弹性伸缩服务,不断调试找到合适的伸缩策略;还要自己采集日志来创建告警和监控大盘。这一套下来运维和部署成本其实不是很低,有没有更省事的方案呢?


小王进一步调研了 K8s 架构,k8s 的 Services 与 Ingress 规则可以管理到应用层的访问,这样就不用自己搞SLB负载均衡了,同时使用HPA来根据应用水位来水平伸缩。这样看似很不错,但真正测试时发现,HPA的伸缩是分钟级别的,缩容慢一点倒是问题不大,但流量上涨快的时候,扩容总是延后几分钟,会导致部分请求延时增高或失败,影响了服务可用性。如果把扩容的指标阈值调低些,倒是能够解决这个问题,但同时降低了资源利用率,成本上涨了不少。另外还需要自己搞日志采集、告警和监控大盘,运维成本也有不少。而且小王之前没有接触过k8s,k8s繁多的各种概念理解起来着实也有不少的成本。


基于FC的架构能够很好的解决上面几个问题。首先,FC 支持预留模式和基于实例指标的自动伸缩能力,这种模式下能够做到更灵敏和快速的扩缩容能力,并保证在扩缩容期间请求延时保持平稳;其次,FC高 度集成了众多开箱即用的功能,体验丝滑又省心,如:提供http触发器,省去对接网关、SLB的工作;控制台提供完整的可观测能力,轻松查看请求、实例状态和运行日志。最后,FC只需要为调用和调用时使用的活跃资源付费,无调用时不产生费用,能够充分提高资源利用率,减低成本。


下面我们来具体介绍下预留模式的使用,以及如何通过闲置计费来降低预留的使用成本。


预留模式,完美解决冷启动

FC支持按量和预留两种使用模式,按量模式是通过请求自动触发实例的创建和扩缩容,在调用量增加时创建实例,在请求减少后销毁实例。按量模式充分提高了资源利用率,但对于小王这种启动时间比较长的应用,按量模式创建实例时会有明显的冷启动现象。为了解决这种冷启动问题,FC提供了预留的使用模式。用户配置预留后,FC会创建指定数量的预留实例常驻于系统中,直到用户更新预留配置将其释放。当有请求时,会优先调度上预留实例上,预留实例用满后,新请求会触发按量实例的创建。同时为了使预留实例量更好地贴合业务曲线,还提供了预留定时伸缩和按指标伸缩能力,来提高预留实例的利用率。点击这里查看更多详情。


通过这样的方式,即解决了应用冷启动时间长的问题,又保证了预留实例维持在比较高的利用率水平。即使偶尔有比较大的流量波动,也可以临时扩容出按量实例来响应请求,尽量保证流量快速上涨情况下服务的质量。


闲置计费,降本大杀器

在真实的使用场景中,为了保证应用请求的低延时,即使在没有请求时,也要保持一定数量的预留实例,这就造成了成本的上升。有没有办法既做到低延时,又做到低成本呢?函数计算为了帮助用户降低这种场景下的使用成本,推出了预留实例的闲置计费功能,下面我们来具体了解下这个功能。


闲置计费

根据预留实例是否在处理请求,我们将实例区分为闲置、活跃两种状态,并为两种状态分别设置了计费单价。活跃计费单价与原有的资源使用单价保持一致,闲置计费单价是活跃计费单价的20%,开启闲置计费后能够帮助您节省大量的成本。



默认情况下,闲置计费功能处于关闭状态,此时预留模式的实例无论是否正在处理请求,FC都会为其分配CPU,并让实例始终处于活跃状态,以保证实例在无请求时依然可以正常运行后台任务。开启闲置计费功能后,当预留模式的实例无请求时,FC会将实例上的CPU冻结,使该实例进入闲置状态。



通过增加闲置计费,对于预留实例也做到了只为真正使用的CPU资源付费。当预留实例处于闲置时,只需支付20%的费用,就能应对实例冷启动的问题。这将帮助用户明显降低预留实例的使用成本,同时用户也可以更少的关心预留实例的利用率问题,放心大胆的使用预留实例。

我们以上图为例,假设预留实例的利用率为60%,原有的使用成本为1。使用闲置计费后费用为60% * 1 + 40% * 20% *1 = 0.68,能够带来32%的费用下降。


配置方式

可以通过控制台和SDK两种方式进行预留实例和闲置计费的配置。


登录函数计算控制台,在首页->弹性管理页面选择创建规则,即可进行『闲置计费』的配置。同时可以使用SDK进行配置,支持Java、Go、Node.js等多种语言,详情可以参考API在线调试



开启闲置计费后,可以在费用中心-账单详情-明细账单中查到弹性实例和性能实例的闲置资源使用费用(计费账单一般延时3~6小时产出)。



结语


函数计算(FC)一直致力于为用户提供高弹性、免运维、低成本的全托管计算服务。本次闲置计费功能的发布,能够帮助用户进一步降低使用预留实例的成本,让用户只为真实使用的预留资源付费。函数计算会逐步释放更多serverless 的技术红利,在性能、成本、体验上不断为用户提供更极致的表现。


文档链接:

弹性管理:https://help.aliyun.com/document_detail/185038.html

计费概述:https://help.aliyun.com/document_detail/54301.html

相关实践学习
【玩转ComfyUI】基于函数计算一键部署AI生图平台ComfyUI
本次实验将带大家通过使用阿里云产品函数计算FC,快速使用ComfyUI实现更高质量的图像生成。
从 0 入门函数计算
在函数计算的架构中,开发者只需要编写业务代码,并监控业务运行情况就可以了。这将开发者从繁重的运维工作中解放出来,将精力投入到更有意义的开发任务上。
相关文章
|
存储 SQL 弹性计算
元数据驱动的 SaaS 架构与背后的技术思考
在抽象能力以及沉淀了产品的基础上,把所承载和沉淀的业务能力快速输出,贡献给整个行业。
10909 123
元数据驱动的 SaaS 架构与背后的技术思考
|
6月前
|
安全 数据安全/隐私保护
1.什么是权限管理
本文介绍了权限管理中的两大核心机制:认证与授权。认证用于验证用户身份,确保登录安全;授权则根据角色分配权限,控制用户可访问的资源与操作。二者结合,构建起系统安全的基石,有效防止越权操作与数据泄露,保障应用稳定运行。
 1.什么是权限管理
|
6月前
|
XML SQL Java
整合Logback,滚动记录+多文件
logback-spring.xml为Spring Boot项目日志配置文件,支持控制台与文件输出,按级别、模块分离日志(如SQL、支付、定时任务等),通过LogProxy获取指定名称的Logger,实现精细化日志管理,支持滚动记录与自动清理,适用于多环境部署。
|
6月前
|
人工智能 自然语言处理 算法
2025 年GEO行业年度发展报告
2025年全球生成式引擎优化(GEO)行业迎来规模化爆发,市场规模突破120亿美元,亚太成增长核心。技术实现多模态、实时语义突破,中国服务商即搜AI、边鱼科技凭借高效响应与本地化能力崛起,推动全球竞争格局重塑,开启AI时代“信源主权”争夺新阶段。(238字)
|
9月前
|
人工智能 Serverless API
函数计算的云上计费演进:从请求驱动到价值驱动,助力企业走向 AI 时代
函数计算计费方式历经三阶段演进:从按请求计费,到按活跃时长毫秒级计费,再到按实际资源消耗分层计费。背后是资源调度、安全隔离与开发体验的持续优化。尤其在AI时代,低负载减免、会话亲和等技术让计费更贴近真实价值,推动Serverless向“按需使用、按量付费”终极目标迈进。
|
算法 物联网 数据库
阿里云 OpenSearch RAG 应用实践
本文介绍了阿里云OpenSearch在过去一年中在RAG方面的应用和探索。
29046 4
阿里云 OpenSearch RAG 应用实践
|
存储 监控 算法
安科瑞AM2SE防孤岛装置产品介绍及安装教程
AM2SE-V防孤岛保护装置适用于35kV、10kV及380V新能源并网供电系统,能在孤岛现象时快速切除并网点,保障电站与人员安全。装置具备高性能硬件平台、丰富接口资源、高可靠性设计等特点,并支持多种通讯规约,便于自动化系统集成。其操作简便,具备人性化界面与详细的安装指南。
|
JavaScript 前端开发 IDE
【TypeScript技术专栏】TypeScript与Node.js后端开发
【4月更文挑战第30天】TypeScript在Node.js后端开发中日益重要,作为JavaScript超集,它提供静态类型检查和面向对象编程,增强代码可靠性和维护性。集成TypeScript能带来类型安全、更好的IDE体验、易于维护的代码以及增强工具支持。通过安装TypeScript编译器、编写TypeScript文件、配置TSconfig,开发者可以在Node.js项目中利用其高级特性,提高代码质量和开发效率。实践案例显示,TypeScript能确保路由处理器的类型正确,降低错误率。随着社区发展,TypeScript成为提升Node.js开发体验的推荐选择。
1238 0
|
中间件 测试技术 Serverless
云函数
云函数
4549 1
|
自然语言处理 达摩院
Model Scope分词能力分析杰伦歌词
本文介绍了一种使用分词能力分析周杰伦歌词数据的方法,这里我们采用达摩院基于预训练语言模型构建的分词模型作为我们的分词工具

相关产品

  • 函数计算