Linux 进程调度器入门

简介: Linux 进程调度器入门

进程调度器

对于CPU进程调度,目前主流的方式是两种,第一种是像window那样抢占式调度,每一个CPU可能会出现调度时间分配不等的情况,这是由于历史硬件单核性能强多核性能弱考虑。

而另一种是时间分片的方式,时间分片是Linux 常见的进程调度器,特点是每一个进程有近似相等的CPU使用权,在使用完成之后立马交给下一个进程完成工作,使用分片的方式虽然可能导致一些重要任务延迟,但这样的处理和调度方式使得系统最为稳定。

一些结论

针对Linux进程调度可以有下面的思考:

  • 每一个CPU同一时间只能调度一个进程
  • 每一个进程有*近乎相等的执行时间
  • 对于逻辑CPU而言进程调度使用轮询的方式执行,当轮询完成则回到第一个进程反复
  • 进程数量消耗时间和进程量成正比

对于进程调度来说不能保证一个程序是连续完成的,由于CPU调度和进程切换,上下文也会出现切换情况。

进程状态

对于大部分进程来说,当我们不使用的时候多数处于睡眠状态。

除了睡眠状态之外,进程还有下面几种状态

  • 运行状态:获得CPU调度,执行进程任务
  • 僵死状态:进程等待结束,等待父进程回收
  • 就绪状态:具备运行条件,等待CPU分配
  • 睡眠状态:进程不准备运行除非某种条件触发才会获得CPU调度分配。

对于处在睡眠态的进程触发运行态的条件如下

  • 外部存储器访问,
  • 用户键入或者鼠标操作触发事件
  • 等待指定时间
  • 等待指定时间

通过ps ax命令可以查看当前的进程状态,下面的案例以个人的Mac电脑为例:

shell

复制代码

MacBook-Pro ~ % ps ax
  PID   TT  STAT      TIME COMMAND
32615   ??  Ss     0:00.11 /usr/libexec/nearbyd
32632   ??  Ss     0:00.51 /System/Library/CoreServices/Screen Time.app/Content
32634   ??  Ss     0:00.02 /System/Library/PrivateFrameworks/Categories.framewo
32635   ??  S      0:00.12 /System/Library/CoreServices/iconservicesagent
32636   ??  Ss     0:00.05 /System/Library/CoreServices/iconservicesd
32671   ??  S      0:02.44 /Applications/Microsoft Edge.app/Contents/Frameworks
32673   ??  S      0:02.86 /Applications/Microsoft Edge.app/Contents/Frameworks
32678   ??  Ss     0:00.17 /System/Library/PrivateFrameworks/UIFoundation.frame
32726   ??  S      0:00.07 /System/Library/Frameworks/CoreServices.framework/Fr
32736   ??  S      0:00.08 /System/Library/Frameworks/CoreServices.framework/Fr
32738   ??  S      0:00.75 /System/Applications/Utilities/Terminal.app/Contents
32739   ??  Ss     0:00.02 /System/Library/PrivateFrameworks/Categories.framewo
32746   ??  Ss     0:00.03 /System/Library/Frameworks/Metal.framework/Versions/
32740 s000  Ss     0:00.02 login -pf xxxxxx
32741 s000  S      0:00.03 -zsh
32750 s000  R+     0:00.01 ps ax

s表示sleep,d表示此时可能在等待磁盘IO,但是如果长时间处于D状态则可能是磁盘IO等待超时或者内核可能发生故障。

image.png

那么如果只执行一个进程,同时在进程中间休眠过一次,那么休眠的时候进程在干什么?

此时进程会进入一个空进程的模式轮询,但是空进程不是没有事做,而是需要调用一些维持系统运行的线程,为了保证系统正常稳定运行。

如果只有CPU和空闲进程,那么同样会不断的切换睡眠态和运动态,运动态获取用户输入操作完成动作,睡眠态则执行一些轻量操作。

针对睡眠态的进程会有如下特点:

  • 遵循同一时间CPU只能完成一个进程操作
  • 睡眠态不占用CPU时间,也就是完全不管。

吞吐量和延迟

  1. 吞吐量:处理完成的进程数量 / 耗费时间
  2. 延迟:结束处理时间 - 开始处理时间

通过这两点可以总结几个规则:吞吐量的上限是进程的数量多过逻辑CPU的数量,则再增加进程无法增加吞吐量,另外进程中的延迟总是平均的,也就是说多个进程执行会获得近似平均的延迟,最后进程越多延迟越高。

但是现实系统没有那么多理想情况,多数情况是下面几种:

  • 空闲进程,此时吞吐量很低,因为很多逻辑CPU都在睡眠状态
  • 进程运行态,但是没有就绪,比较理想,CPU可以安排到下一次处理,此时虽然不会延长,但是会出现CPU空闲的情况
  • 进程运行态,同时都就绪,此时就好像赛跑,但是只有一个跑道,跑得快的可以抢着多处理,但是总归都要跑完赛道,所以此时延迟变长

最后其实由于程序编写都是单线程的情况,一核运行,多核围观或许在过去更位普遍。

最终主要的优化方式是使用 sar 命令找到运行时间和开销最大进程,同时把一些死进程kill掉。

多CPU调度情况

因为是分片时间每一个进程用一个CPU工作,那么分配和调度CPU安排工作又是如何的? 主要有两种方式,第一种是通过轮询的负载均衡,另一种是全局分配,把任务分配给空闲进程的逻辑CPU。

负载均衡是CPU遇到进程任务依次安排工作,当最后一个CPU安排完成之后,则再回到第一个CPU进行分配,同时都是对于进程执行一定的时间,也就是说出现CPUa处理一部分,另一部分可能是CPUb完成。 全局分配的方式比较简单,就是把任务分配给处于空闲进程的逻辑CPU完成工作。

查看系统逻辑CPU的命令如下:

grep -c processor /proc/cpuinfo

多核cpu通常只有在同时运行多个进程的时候才会发挥作用,但是并不是说有多少核心就有多少倍性能,因为大部分时候进程很少很多CPU都在睡眠态度

如果进程超过逻辑CPU数量,无论怎么增加进程都不会提高处理速度

最后处于睡眠状态的进程其实可以指定睡眠时间,通过sleep函数调用完成进程休眠的操作。


相关文章
|
9月前
|
存储 弹性计算 测试技术
10分钟私有部署QwQ-32B模型,像购买Ecs实例一样快捷
虽然阿里云提供了基于 IaaS 部署 QwQ-32B 模型的方式,但传统的基于IaaS的部署方式需要用户自行配置环境、安装依赖、优化硬件资源,并解决复杂的网络与存储问题,整个流程不仅耗时耗力,还容易因操作失误导致各种不可预见的问题。 因此,阿里云计算巢提供了基于ECS镜像与VLLM的大模型一键部署方案,通过ECS镜像打包标准环境,通过Ros模版实现云资源与大模型的一键部署,用户无需关心模型部署运行的标准环境与底层云资源编排,10分钟即可部署使用QwQ-32B模型,15分钟即可部署使用Deepseek-R1-70B模型。
|
存储 NoSQL 网络协议
PG内核解读-第1节PostgreSQL系统概述
本文整理自阿里云数据库开源社区Maintainer于巍(花名漠雪),在PostgreSQL数据库内核解读系列的分享。本篇内容主要分为四个部分: 1. 本系列教程介绍 2. PostgreSQL概述(历史、架构) 3. PostgreSQL安装启动 4. PostgreSQL常用命令、调试
PG内核解读-第1节PostgreSQL系统概述
|
负载均衡 Java 开发者
细解微服务架构实践:如何使用Spring Cloud进行Java微服务治理
【7月更文挑战第1天】Spring Cloud是Java微服务治理明星框架,整合Eureka(服务发现)、Ribbon(客户端负载均衡)、Hystrix(熔断器)、Zuul(API网关)和Config Server(配置中心),提供完整服务治理解决方案。通过Eureka实现服务注册与发现,Ribbon进行客户端负载均衡,Hystrix确保服务容错,Config Server集中管理配置,Zuul作为API网关简化系统复杂性。理解和使用Spring Cloud是现代Java开发者的关键技能。
359 0
|
存储 算法 Unix
解锁Linux魔法:轻松学会解压与压缩(zip,tar)
解锁Linux魔法:轻松学会解压与压缩(zip,tar)
675 0
|
安全 Devops Java
你以为搞个流水线每天跑,团队就在使用CI/CD实践了?
在实践中,很多团队对于DevOps 流水线没有很透彻的理解,要不就创建一大堆流水线,要不就一个流水线通吃。实际上,流水线的设计和写代码一样,需要基于“业务场景”进行一定的设计编排,特别是很多通过“开源工具”搭建的流水线,更需要如此(商业的一体化平台大部分已经把设计思想融入自己产品里了)。 • 流水线的设计与分支策略有关 • 流水线的设计与研发活动有关 清晰的代码结构,标准的环境配置,原子化的流水线任务编排,再加上团队的协作纪律,和持续优化的动作,才是真正的践行CI/CD实践
615 4
|
JavaScript 安全 Java
【开源】 Spring Boot 3 + Vue 3 前后端分离权限管理系统说明文档
【开源】 Spring Boot 3 + Vue 3 前后端分离权限管理系统说明文档
|
SQL 关系型数据库 MySQL
重磅⎮全球最受欢迎的开源数据库之一,今日免费试用!
RDS MySQL Serverless实例是阿里云针对中小型企业或个人开发者推出的一款数据库。提供了CPU、内存的实时弹性能力,提供计算资源按需计费的能力,具有资源用量低、简单易用、弹性灵活和价格低廉等优点。
重磅⎮全球最受欢迎的开源数据库之一,今日免费试用!
|
Java Windows
JDK17 || JDK 8 完美 卸载 教程 (Windows版) 完整指南:卸载JDK17和JDK8,并安装新版JDK
JDK17 || JDK 8 完美 卸载 教程 (Windows版) 完整指南:卸载JDK17和JDK8,并安装新版JDK
4924 0
|
XML 数据采集 存储
Yolo-V5目标检测 项目实战
Yolo-V5目标检测 项目实战
|
IDE 开发工具 芯片
ESP32CAM,点亮一个LED(Arduino平台)
ESP32CAM,点亮一个LED(Arduino平台)
816 0