Plugsched 实战解读:如何在不中断业务时对 Linux 内核调度器热升级? | 龙蜥技术

简介: plugsched 如何使用?每一步的操作如何进行以及背后的工作是什么?

编者按:随着 Linux 内核的不断更新迭代,代码变得越来越繁重。调度器是内核最核心的子系统之一,它的结构复杂,与其它子系统紧密耦合,这使得开发和调试变得越发困难。Plugsched 是 Linux 内核调度器子系统热升级的 SDK,它可以实现在不重启系统、应用的情况下动态替换调度器子系统,毫秒级 downtime。本文整理自龙蜥大讲堂第 18 期精彩分享视频回放已上传至龙蜥官网,欢迎查看!


以下是龙蜥社区 Kernel SIG 核心成员分享《关于 Plugsched 调度器热升级》部分精彩内容(完整视频回放和技术 PPT 获取方式见文末)

640 (5).png

Plugsched 是 Linux 内核调度器子系统热升级的 SDK,它可以实现在不重启系统、应用的情况下动态替换调度器子系统,毫秒级 downtime。Plugsched 可以对生产环境中的内核调度特性动态地进行增、删、改,以满足不同场景或应用的需求,且支持回滚。目前已经在龙蜥社区开源了。


开源地址:

https://gitee.com/anolis/plugsched


随着 Linux 内核的不断更新迭代,代码变得越来越繁重。调度器是内核最核心的子系统之一,它的结构复杂,与其它子系统紧密耦合,这使得开发和调试变得越发困难。而且,调度器内嵌在内核中,应用新的调度器需要更换内核,这在集群中代价比较昂贵。再者,目前不存在子系统范围的热升级方案,kpatch、livepatch 是函数粒度的热升级方案,eBPF 目前还不支持调度器。对于调度器而言,由于应用场景及其特征的多样性,使得调度策略的优化比较复杂,尤其在云场景下,不存在“一劳永逸”的策略,因此,允许用户定制调度器满足不同的场景是必要的。


基于以上背景,Plugsched 诞生了,它能将调度器子系统从内核中提取出来,以模块的形式对内核调度器进行热升级。通过对调度器模块的修改,能够针对不同业务定制化调度器,而且使用模块能够更敏捷的开发新特性和优化点,并且可以在不中断业务的情况下上线。


本文从 plugsched 的 背景、优势、应用场景和原理四个方面展开分享,通过一个实际案例体现出 plugsched 的价值所在,最后给大家进行了实际操作的演示,演示过程中,详细介绍了 plugsched 如何使用、每一步的操作如何进行以及背后的工作是什么。

640.png

640 (1).png

640 (2).png

640 (3).png

640 (4).png

接下来是演示过程,可以参考开源仓库的 Readme 中的 Quick Start 章节,Plugsched SDK 提供了 容器化的开发环境,通过实际操作,可以很快学会如何使用它(演示视频已上传至龙蜥官网,欢迎查看)


最后,讲师与线上听众进行了 Q&A 互动,本文主要摘录以下 5 个问题:


Q:回滚之后,内核原来的调度器如何重新生效?

A:安装调度器包后,相当于系统中存在两个调度器,一个是内核原有的调度器,另一个是新安装的调度器。安装新的调度器安装后,内核原有的调度器相当于被旁路掉了。当新的调度器包被卸载(回滚)后,内核原有的调度器相当于被重新 enable,会自动生效。


Q:Plugsched 与 sched eBPF 有什么区别?

A:目前,上游社区还不支持调度器 eBPF 的 hook 点,即便是支持了,也只能支持局部策略的修改,可修改能力有限。而且 eBPF 不能实现很复杂的修改,它的检查机制很严格,不能实现复杂的逻辑,修改能力进一步受限。


Q:Google 的 ghOSt,似乎是和 plugsched 做类似的工作?两者有什么区别?

A:ghOSt 与 plugsched 面向的场景不同,性能也不同。ghOSt 有两种工作模式,local 模式开销较大,每次调度要多经历一次上下文切换,即切入切出用户态调度器软件,所以只能在一些延迟要求不高的场景用。而 global 模式过度依赖 IPI,IPI 的开销会导致调度不及时,增加延时。再者,ghOSt 针对无内核开发经验的用户态软件开发者,容错性比较高,但是性能相对较差,只能用于部分场景。plugsched 依旧针对内核开发者,要求开发者有与传统内核同样的开发经验,但是为内核开发者降低开发、测试、上线、回滚的难度,性能好,能用于绝大部分场景。


Q:Plugsched 在做模块化的过程中开销如何?

A:对于模块化的开销,可以不需要太关注,因为这个过程是 offline 的,而且生成调度器模块后,可以持续修改和生成 RPM 包。对于它的开销,演示过程使用的环境是 64 核 CPU,生成调度器模块的时间大约是 2-3 分钟,应为它需要编译一次内核,开销并不是很高。


Q:系统重启或者更换内核是否有影响?

A:plugsched 支持安装多内核版本的调度器包,就像可以同时安装多个版本的内核一样。当系统重启后,plugsched 会自动识别并安装当前内核版本的调度器模块,即便是不存在对应内核版本的调度器,也不会安装其它内核版本的调度器模块。因此,系统重启或更换内核并没有什么影响。


关于回放和课件获取

【视频回放】:视频回访已上传至龙蜥官网:https://openanolis.cn/video查看。

【PPT课件获取】:获取链接:https://www.yuque.com/anolis-docs/courses有任何疑问请随时咨询龙蜥助手—小龙(微信:openanolis_assis)


Plugsched 相关阅读:

龙蜥开源Plugsched:首次实现 Linux kernel 调度器热升级

欢迎更多开发者加入Kernel SIG:

网址:https://openanolis.cn/sig/Cloud-Kernel

邮件:cloud-kernel@lists.openanolis.cn

—— 完 ——

加入龙蜥社群

加入微信群:添加社区助理-龙蜥社区小龙(微信:openanolis_assis),备注【龙蜥】与你同在;加入钉钉群:扫描下方钉钉群二维码。欢迎开发者/用户加入龙蜥社区(OpenAnolis)交流,共同推进龙蜥社区的发展,一起打造一个活跃的、健康的开源操作系统生态!

公众号&小龙交流群.png

关于龙蜥社区

龙蜥社区(OpenAnolis)由企事业单位、高等院校、科研单位、非营利性组织、个人等在自愿、平等、开源、协作的基础上组成的非盈利性开源社区。龙蜥社区成立于 2020 年 9 月,旨在构建一个开源、中立、开放的 Linux 上游发行版社区及创新平台。


龙蜥社区成立的短期目标是开发龙蜥操作系统(Anolis OS)作为 CentOS 停服后的应对方案,构建一个兼容国际 Linux 主流厂商的社区发行版。中长期目标是探索打造一个面向未来的操作系统,建立统一的开源操作系统生态,孵化创新开源项目,繁荣开源生态。


目前,Anolis OS 8.4已发布,支持 X86_64 、Arm64、LoongArch 架构,完善适配 Intel、兆芯、鲲鹏、龙芯等芯片,并提供全栈国密支持。


欢迎下载:

https://openanolis.cn/download

加入我们,一起打造面向未来的开源操作系统!

https://openanolis.cn

相关文章
|
20天前
|
算法 Linux
深入探索Linux内核的内存管理机制
本文旨在为读者提供对Linux操作系统内核中内存管理机制的深入理解。通过探讨Linux内核如何高效地分配、回收和优化内存资源,我们揭示了这一复杂系统背后的原理及其对系统性能的影响。不同于常规的摘要,本文将直接进入主题,不包含背景信息或研究目的等标准部分,而是专注于技术细节和实际操作。
|
20天前
|
存储 缓存 网络协议
Linux操作系统的内核优化与性能调优####
本文深入探讨了Linux操作系统内核的优化策略与性能调优方法,旨在为系统管理员和高级用户提供一套实用的指南。通过分析内核参数调整、文件系统选择、内存管理及网络配置等关键方面,本文揭示了如何有效提升Linux系统的稳定性和运行效率。不同于常规摘要仅概述内容的做法,本摘要直接指出文章的核心价值——提供具体可行的优化措施,助力读者实现系统性能的飞跃。 ####
|
21天前
|
监控 算法 Linux
Linux内核锁机制深度剖析与实践优化####
本文作为一篇技术性文章,深入探讨了Linux操作系统内核中锁机制的工作原理、类型及其在并发控制中的应用,旨在为开发者提供关于如何有效利用这些工具来提升系统性能和稳定性的见解。不同于常规摘要的概述性质,本文将直接通过具体案例分析,展示在不同场景下选择合适的锁策略对于解决竞争条件、死锁问题的重要性,以及如何根据实际需求调整锁的粒度以达到最佳效果,为读者呈现一份实用性强的实践指南。 ####
|
21天前
|
缓存 监控 网络协议
Linux操作系统的内核优化与实践####
本文旨在探讨Linux操作系统内核的优化策略与实际应用案例,深入分析内核参数调优、编译选项配置及实时性能监控的方法。通过具体实例讲解如何根据不同应用场景调整内核设置,以提升系统性能和稳定性,为系统管理员和技术爱好者提供实用的优化指南。 ####
|
Linux 调度
linux调度器源码分析 - 初始化(二)
本文为原创,转载请注明:http://blog.chinaunix.net/uid/26772321.html 引言   上期文章linux调度器源码分析 - 概述(一)已经把调度器相关的数据结构介绍了一遍,本篇着重通过代码说明调度器在系统启动初始化阶段是如何初始化和工作的。
1032 0
|
Linux 调度
linux调度器源码分析 - 新进程加入(三)
本文为原创,转载请注明:http://blog.chinaunix.net/uid/26772321.html  引言   之前的文章已经介绍了调度器已经初始化完成,现在只需要加入一个周期定时器tick驱动它进行周期调度即可,而加入定时器tick在下一篇文章进行简单说明(主要这部分涉及调度器比较少,更多的是时钟、定时器相关知识)。
1087 0
|
Linux 调度
linux调度器源码分析 - 运行(四)
本文为原创,转载请注明:http://blog.chinaunix.net/uid/26772321.html 引言   之前的文章已经将调度器的数据结构、初始化、加入进程都进行了分析,这篇文章将主要说明调度器是如何在程序稳定运行的情况下进行进程调度的。
902 0
|
1月前
|
Linux 网络安全 数据安全/隐私保护
Linux 超级强大的十六进制 dump 工具:XXD 命令,我教你应该如何使用!
在 Linux 系统中,xxd 命令是一个强大的十六进制 dump 工具,可以将文件或数据以十六进制和 ASCII 字符形式显示,帮助用户深入了解和分析数据。本文详细介绍了 xxd 命令的基本用法、高级功能及实际应用案例,包括查看文件内容、指定输出格式、写入文件、数据比较、数据提取、数据转换和数据加密解密等。通过掌握这些技巧,用户可以更高效地处理各种数据问题。
107 8
|
1月前
|
监控 Linux
如何检查 Linux 内存使用量是否耗尽?这 5 个命令堪称绝了!
本文介绍了在Linux系统中检查内存使用情况的5个常用命令:`free`、`top`、`vmstat`、`pidstat` 和 `/proc/meminfo` 文件,帮助用户准确监控内存状态,确保系统稳定运行。
375 6
|
1月前
|
Linux
在 Linux 系统中,“cd”命令用于切换当前工作目录
在 Linux 系统中,“cd”命令用于切换当前工作目录。本文详细介绍了“cd”命令的基本用法和常见技巧,包括使用“.”、“..”、“~”、绝对路径和相对路径,以及快速切换到上一次工作目录等。此外,还探讨了高级技巧,如使用通配符、结合其他命令、在脚本中使用,以及实际应用案例,帮助读者提高工作效率。
86 3