带你读《2022龙蜥社区全景白皮书》——5.3.5 敏捷开发场景下的调度器热升级SDK

本文涉及的产品
Serverless 应用引擎免费试用套餐包,4320000 CU,有效期3个月
任务调度 XXL-JOB 版免费试用,400 元额度,开发版规格
云原生网关 MSE Higress,422元/月
简介: 带你读《2022龙蜥社区全景白皮书》——5.3.5 敏捷开发场景下的调度器热升级SDK

5.3.5 敏捷开发场景下的调度器热升级SDK


背景概述


不同的应用程序,通常需要不同的调度策略来优化性能。而内核发布周期很长,升级内核的成本通常较高,优化无法快速规模化部 署。并且针对特定应用的调度器优化,常常造成其他场景的性能回退,发生问题也难以回滚。通过传统热修复技术,可以在不升级 内核的情况下,实现内核局部更新和优化,针对性提升一些应用的性能。但传统技术无法实现整个子系统升级,不支持大型调度特 性,停机时间长。而调度器热升级技术解决了以上问题。


技术方案  


调度器热升级SDK通过模块化、数据重建、热替换等技术,实现调度器研发、测试、上线、维护的敏捷化和定制化。其中,模块化 技术自动地从内核中解耦出调度器模块代码,面向内核开发者提供敏捷开发的SDK;热替换技术使得管理员可在毫秒级downtime 内部署;数据重建技术将数据状态从升级前的调度器迁移到升级后的调度器。通过这些技术,可以实现定制化调度器,从而解决不 同应用和负载需要不同调度器的问题,并实现生产可用。软件架构如下图所示:


image.png


方案兼容多架构、内核版本。已测试通过的包括aarch64、x86-64架构;4.19、5.10系列内核。其余版本正在测试支持中。方案同 时支持各种调度器特性,经测试验证通过的包括以下:微型调度器、物理核调度器(Core Scheduling)、删除限流功能(CFS  bandwidth control)、龙蜥CPU混部特性等、上游Linux社区的各种bugfix。


应用场景及性能收益


调度器热升级SDK适合于下面几种场景,这些场景均已得到验证。

- 架构上有针对特殊硬件、应用、负载来定制化调度器的需求。

- 管理员不能切换内核,或周期很长;或由于社区运作停止内核版发布和维护。

- 内核开发者需要敏捷且可回滚地开发测试上线调度器。


某云Serverless服务,通过调度器热升级SDK,将Linux上游物理核调度器特性,以及基于之上自研的算力稳定技术,安装到较老的 ANCK 4.19内核的系统上。最后通过这一优化,他们的客户实例减少了约10%的P99延迟,并降低了性能的抖动,还大幅降低了启动 时间。验证了调度器热升级方便支持大型特性以及扩展研发的能力。


某云容器服务,基于龙蜥操作系统为客户提供混部技术,但部分客户同时也使用CentOS系统,他们发现使用CentOS的客户无法享 受到龙蜥操作系统同等的混部能力。因此通过调度器热升级SDK,将龙蜥内核的CPU混部技术安装到CentOS内核,让使用CentOS 的客户也能使用龙蜥操作系统的CPU混部技术。


某互联网金融服务公司,利用调度器热升级SDK,敏捷地将他们自研的调度器优化安装到他们的核心业务中。包括了Linux CFS调度 器和ANCK的CPU资源隔离技术的优化。稳定减少了5%的CPU资源浪费,同时降低业务rt。上线过程中,在40,000线程的环境中, 停机时间小于12ms。最终优化效果得到运维人员的认可,调度器热升级SDK的易用性也得到研发人员的认可,希望继续使用调度器 热升级SDK进行系统优化。



相关文章
|
JSON Serverless API
Serverless 应用引擎常见问题之通过SDK修改调度器报错如何解决
Serverless 应用引擎(Serverless Application Engine, SAE)是一种完全托管的应用平台,它允许开发者无需管理服务器即可构建和部署应用。以下是Serverless 应用引擎使用过程中的一些常见问题及其答案的汇总:
121 0
|
开发工具 C++ 容器
带你读《2022技术人的百宝黑皮书》——跨全端SDK技术演进(1)
带你读《2022技术人的百宝黑皮书》——跨全端SDK技术演进(1)
187 0
|
3月前
|
存储 Java API
MinIO Java SDK 7.1.4 升级到 8.5.17 需要注意什么
现在我需要你帮我分析对比这个两个sdk在对外的接口设计上是否有不兼容的变更
292 5
|
9月前
|
监控 开发工具 Android开发
ARMS 用户体验监控正式发布原生鸿蒙应用 SDK
阿里云 ARMS 用户体验监控(RUM)推出了针对原生鸿蒙应用的 SDK。SDK 使用 ArkTS 语言开发,支持页面采集、资源加载采集、异常采集及自定义采集等功能,能够全面监控鸿蒙应用的表现。集成简单,只需几步即可将 SDK 接入项目中,为鸿蒙应用的开发者提供了强有力的支持。
477 112
|
4月前
|
开发框架 人工智能 大数据
HarmonyOS Next~HarmonyOS SDK应用服务:开发者的全新技术生态
本文深入解析了HarmonyOS SDK应用服务的技术架构与开发优势,涵盖其分布式服务框架、核心特性和开发流程。HarmonyOS凭借统一开发框架、高效跨设备协同及低延迟系统服务,为开发者提供全新技术生态。未来,随着生态完善,SDK将在智能设备场景支持、AI与大数据集成等方面持续演进,助力开发者释放创新潜力。
190 0
|
存储 Java 开发工具
【Azure 存储服务】Azure Blob Storage SDK 升级失败,遇见 Unsatisfied Dependency Exception 和 Unexpected Length Exception
【Azure 存储服务】Azure Blob Storage SDK 升级失败,遇见 Unsatisfied Dependency Exception 和 Unexpected Length Exception
108 0
|
11月前
|
存储 安全 开发工具
百度公共IM系统的Andriod端IM SDK组件架构设计与技术实现
本文主要介绍了百度公共IM系统的Andriod端IM SDK的建设背景、IM SDK主要结构和工作流程以及建设过程遇到的问题和解决方案。
170 3
|
11月前
|
存储 文字识别 算法
解析!文档扫描 SDK 中的高级图像处理技术
本博客讨论了图像质量在文档扫描中的重要性,解决了扫描过程中遇到的常见挑战,以及文档扫描 SDK 利用先进的图像处理技术来应对这些挑战。
|
编解码 Linux 开发工具
大牛直播SDK跨平台RTMP直播推送模块技术设计和功能列表
大牛直播SDK是一款跨平台RTMP直播推送模块,支持Windows、Linux(x64_64与aarch64架构)、Android及iOS平台。该SDK功能全面,包括摄像头、屏幕、麦克风等数据采集与推送,并支持编码前后数据对接。其架构设计优秀,确保低延迟与高效率,结合SmartPlayer播放器实现毫秒级延迟体验。具备全自研框架,易于扩展且支持多种数据源接入,如外部YUV/RGB/H.264等格式。此外,各平台支持特性丰富,如Windows平台支持多摄像头合成,Android与iOS平台支持前后摄像头实时切换等。大牛直播SDK还提供了多个示例项目以帮助开发者快速上手。
382 0
|
存储 安全 机器人
【LLM】智能学生顾问构建技术学习(Lyrz SDK + OpenAI API )
【5月更文挑战第13天】智能学生顾问构建技术学习(Lyrz SDK + OpenAI API )
183 1

热门文章

最新文章