课时5:云原生体系下 Serverless 弹性探索与实践(五)

本文涉及的产品
Serverless 应用引擎免费试用套餐包,4320000 CU,有效期3个月
函数计算FC,每月15万CU 3个月
简介: 云原生体系下 Serverless 弹性探索与实践

Serverless AI训练营:课时5:云原生体系下 Serverless 弹性探索与实践(五)

课程地址https://developer.aliyun.com/trainingcamp/1eeaedf056f14ad98e9986c31068e939?spm=a2c6h.26142516.J_2566289780.1.37c67cbd7bCsFs

课时5:云原生体系下 Serverless 弹性探索与实践(五)

然后应用生命周期管理是可以配置优雅下线,比如执行缩容时应用可能是需要执行一些机械操作,这都可以配置一些通过提供应用生命周期的对应的接口,然后配置对应的脚本来执行。同时建议采取指数重试的机制,实际上也是标配了。

相当于请求的时候,如果是遇到一些情况,然后进行整体的超时重试的处理。以及应用启动速度优化,刚才说的是内部 SE 平台为用户提供一些优化的手段,然后作为用户也可以对应用进行启动优化,其中最主要的是对软件包的优化,比如优化应用的启动时间,减少因内夹带缓存等外部依赖导致的应用的启动,以及优化镜像大小。网上也有很多关于镜像大小如何优化的文章可以参考一下。

2.弹性最佳实践:弹性伸缩配置

在弹性伸缩具体的配置阶段,也要有很多用户困惑具体的指标指的应该配多少,这个也是比较灵活的。弹性伸缩主要配置,刚才说它支持非常多的指标,比如说 CPU 内存等。需要根据应用的具体属性,它是 CPU 敏感还是内存敏感还是IOO 敏感进行灵活的选择。可以通过技术监控或者应用监控它的历史的指标。

比如最近六天,最近十二天七天,或者是它的 CPUP99的数值,然后来预估现在整体的容量负载情况。或者可能这阵儿都没流量,那可以通过 PCS 进行加测,然后来估计应用的负载容量整体是什么情况,然后来了解单实力或者当前应用到底能扛住多少的请求,需要多少 CPU 内存。

以及高负载情况下这个应用会有什么异常的超值还是崩溃等来评估容量大小。而指标值是一个权衡,是一个可能性以及成本的权衡。如果更加侧重于可能性,可以把指标值配低一些,比如 CPU 就是40%就破了。

如果是更加侧重于成本,可以把这个指标值配高一点,如果CPU达到60%再破,或者可能想达到一个平衡,可能性和成本兼具,可以配50%。同时因为这往往应用系统比较复杂,它不是单实业,它是多个系统协作的过程,当一个实际数破的时候,会让整体的上下游,这样也建议梳理整体的上下游,比如依赖的 DB 方向键和相关依赖。并配置相应的弹性规则或者一些垄断的手段来确保扩容时的全连路都是可以曝光可能性。

同时,在配置弹性伸缩之后,也可以通过完善所有性的手段来不断调整弹性配置。刚才说的是指标配置的建议,对于最大值最小值也有一些建议,比如说最大值应该考虑可能区,每个可能区都有对应的IP

要考虑 IP 是否充足,要不就空出来了。最小值建议不要保保持单实力,建议大于等于二,并且配置多层序,这样是可以防止某个可能区有问题就可以迁移到另一个区,或者是单实力完全没有高可用的。因为都是无状态运用,多个实力是完全ok的,可以保证整体的高可能。

3.  弹性最佳实践:弹性伸缩过程

image.png

然后在整个整体的弹性伸缩过程的时候,需要关注几个点,比如说弹性伸缩是否到达最大值了。它意味着一方面可能流量预估不太准,或者是最大值配的可能是有问题,或者是应用可能出现一些异常,可能是异常流量导致实际数已经到达最大值了。

还有可能区再均衡,也是做可能区的时候,扩缩会有一些情况,它的可能区分布不均衡,可以通过重启来实现可能区的再均衡,以及自动恢复弹性配置。在应用部署和自动反应是互斥的,相当于发一个版本的时候会把自动反应给停掉。

因为发版本的时候,势必会影响整个指标移动。可能会把具体实际数和与 HPa 计算的实际数会有冲突,所以实际数给关掉了,但是也非常人性化的这个提供了自动恢复的功能,部署完之后再给回复。

4.  弹性最佳实践:弹性伸缩可观测

image.png

最后是可观测,这里是对弹性的历史记录进行观测,或者是对于弹性的实践进行通知。这是内部的报表,可以看到整体的包括HPA 的配置以及整体的 reconcile,每次请求有一个间隔,还有它的具体的耗时以及对应的监控数据对实际数的整体的变动,内部都可以非常清晰的看懂,对外也是不断完善整体对外报表的开发。

5.  弹性最佳实践:客户案例

image.png

上述是整个用户从配置 HPA,配置弹性伸缩从准备到如何配置,再到配置完之后需要怎么来不断完善的实践。这里讲一个客户案例,这个是在去年相关运行期间,在线教育内非常火。

它流量暴涨七到八倍,硬件成本和业务能性都面临着巨大风险。如果此时用户采取传统的架构,ECS的架构,用户就需要在非常短的时间内来做整个基础架构的升级。这对用户的成本和精力的挑战都是非常大的。

但是如果采用SE,它就充分发挥了 severless 带来的技术能力的作用。用户可以把应用用在SE 上,然后同时通过刚才介绍 SE 的多场景,采用策略的配置,弹性自适性,及时可观测能力,可以轻松应对流量突增的情况。然后通过上述各项能力实现了用户全托管,零改造,极大的减少了它的部署行为的成本,提高它的效率。也保证在流量暴涨七到八倍的情况下,也是保证业务高峰期的SEA

同时借助了刚才说的秒级弹性的节约效率功能,这种特性来节省闲置资源成本,达到了35%

综上在弹性发展上,尤其在收费的场景,更加注重应对突发流量的能力。

SE通过对弹性组件和应用全生命周期的不断优化,达到了秒级弹性,运营在弹性能力上,场景横幅度以及稳定上都有核心的竞争力,是传统应用零改造 severless 的最佳选择。

相关实践学习
【AI破次元壁合照】少年白马醉春风,函数计算一键部署AI绘画平台
本次实验基于阿里云函数计算产品能力开发AI绘画平台,可让您实现“破次元壁”与角色合照,为角色换背景效果,用AI绘图技术绘出属于自己的少年江湖。
从 0 入门函数计算
在函数计算的架构中,开发者只需要编写业务代码,并监控业务运行情况就可以了。这将开发者从繁重的运维工作中解放出来,将精力投入到更有意义的开发任务上。
相关文章
|
3月前
|
运维 监控 Cloud Native
【云故事探索】NO.17:国诚投顾的云原生 Serverless 实践
国诚投顾携手阿里云,依托Serverless架构实现技术全面升级,构建高弹性、智能化技术底座,提升业务稳定性与运行效率。通过云原生API网关、微服务治理与智能监控,实现流量精细化管理与系统可观测性增强,打造安全、敏捷的智能投顾平台,助力行业数字化变革。
【云故事探索】NO.17:国诚投顾的云原生 Serverless 实践
|
3月前
|
运维 监控 Cloud Native
【云故事探索】NO.17:国诚投顾的云原生 Serverless 实践
通过与阿里云深度合作,国诚投顾完成了从传统 ECS 架构向云原生 Serverless 架构的全面转型。新的技术架构不仅解决了原有系统在稳定性、弹性、运维效率等方面的痛点,还在成本控制、API 治理、可观测性、DevOps 自动化等方面实现了全方位升级。
|
1月前
|
人工智能 Cloud Native 算法
拔俗云原生 AI 临床大数据平台:赋能医学科研的开发者实践
AI临床大数据科研平台依托阿里云、腾讯云,打通医疗数据孤岛,提供从数据治理到模型落地的全链路支持。通过联邦学习、弹性算力与安全合规技术,实现跨机构协作与高效训练,助力开发者提升科研效率,推动医学AI创新落地。(238字)
|
3月前
|
弹性计算 运维 Cloud Native
【云故事探索】NO.17:国诚投顾的云原生Serverless实践
简介: 通过与阿里云深度合作,国诚投顾完成了从传统 ECS 架构向云原生 Serverless 架构的全面转型。新的技术架构不仅解决了原有系统在稳定性、弹性、运维效率等方面的痛点,还在成本控制、API 治理、可观测性、DevOps 自动化等方面实现了全方位升级。
141 1
|
2月前
|
存储 弹性计算 Cloud Native
云原生数据库的演进与应用实践
随着企业业务扩展,传统数据库难以应对高并发与弹性需求。云原生数据库应运而生,具备计算存储分离、弹性伸缩、高可用等核心特性,广泛应用于电商、金融、物联网等场景。阿里云PolarDB、Lindorm等产品已形成完善生态,助力企业高效处理数据。未来,AI驱动、Serverless与多云兼容将推动其进一步发展。
187 8
|
存储 Cloud Native 数据处理
从嵌入式状态管理到云原生架构:Apache Flink 的演进与下一代增量计算范式
本文整理自阿里云资深技术专家、Apache Flink PMC 成员梅源在 Flink Forward Asia 新加坡 2025上的分享,深入解析 Flink 状态管理系统的发展历程,从核心设计到 Flink 2.0 存算分离架构,并展望未来基于流批一体的通用增量计算方向。
290 0
从嵌入式状态管理到云原生架构:Apache Flink 的演进与下一代增量计算范式
|
3月前
|
运维 监控 Cloud Native
从本土到全球,云原生架构护航灵犀互娱游戏出海
本文内容整理自「 2025 中企出海大会·游戏与互娱出海分论坛」,灵犀互娱基础架构负责人朱晓靖的演讲内容,从技术层面分享云原生架构护航灵犀互娱游戏出海经验。
427 16
|
3月前
|
运维 监控 Cloud Native
从本土到全球,云原生架构护航灵犀互娱游戏出海
内容整理自「 2025 中企出海大会·游戏与互娱出海分论坛」,灵犀互娱基础架构负责人朱晓靖的演讲内容,从技术层面分享云原生架构护航灵犀互娱游戏出海经验。
|
1月前
|
人工智能 Kubernetes Cloud Native
Higress(云原生AI网关) 架构学习指南
Higress 架构学习指南 🚀写在前面: 嘿,欢迎你来到 Higress 的学习之旅!
494 0
|
7月前
|
运维 Cloud Native 测试技术
极氪汽车云原生架构落地实践
随着极氪数字业务的飞速发展,背后的 IT 技术也在不断更新迭代。极氪极为重视客户对服务的体验,并将系统稳定性、业务功能的迭代效率、问题的快速定位和解决视为构建核心竞争力的基石。

相关产品

  • 函数计算