0 前言
线程和Fiber通常会一起讨论,但它们有各自不同使用场景和性能考虑。
线程和Fiber在抽象和实现上基本相同,主要区别在于使用场景:
- os线程可用于任何语言,但需要大量RAM,且在同步和生成时较慢
- 而Fiber则特定于某个语言或运行时,十分轻量,且同步时几乎没有额外开销
- 虚拟线程随 Java 21 成为永久功能,解决了传统线程的一些性能限制,以最大化硬件性能
1 啥是 Java 中的线程?
线程是由调度程序安排在适当时间运行于 CPU 核心上的续延。续延简单来说就是程序计数器,它标记了我们在指令序列中的位置,以及一个堆栈,用于存储变量的值。
os会看到并使用硬件运行时:包括 CPU、应用数据寄存器、代码寄存器(即程序计数器)、内存寄存器(如堆栈指针)、虚拟内存和 CPU 模式。特别是,当发生陷阱事件或执行系统调用时,CPU可在受限的用户模式和功能更强大的内核模式之间切换。os线程共享大多数内核资源(如 I/O 描述符),且位于同一地址空间:这使得它们比多个单线程os进程更轻,同时允许它们共享数据。但它们不共享 CPU 寄存器,且拥有各自的堆栈,这使它们能并发执行不同的控制流。
2 JVM 线程与调度
线程数量可能超过可用的处理器,因此os需通过调度将它们在 CPU 上切换。调度事件可由抢占事件触发(当线程耗尽它的 CPU 配额时)或代码显式调用系统调用陷阱(如执行内核例程,如 I/O)。CPU会切换到内核模式,并将执行转移到包含陷阱处理程序的特殊内存区域:此时内核可以快照 CPU 寄存器,包括程序计数器和线程堆栈指针,并将它们打包到一个 线程控制块 续延中。
之后,调度程序被调用以选择下一个要运行的线程,可能是在不同的进程中;然后内核恢复所有相关的 CPU 寄存器,并设置处理器切换回用户模式,在恢复的程序计数器地址继续执行。
3 啥是虚拟线程?
虚拟线程是轻量级线程,简化了编写和维护具有高计算要求的并发应用程序的过程。
传统的os线程非常笨重。而虚拟线程则将线程调度的责任从os转移到 JVM,有效地在操作系统和应用程序之间引入了一个抽象层。虚拟线程随 JDK 21 成为永久功能,克服了传统线程的一些性能限制,以最大化硬件性能。
📚 进一步阅读: 深入了解虚拟线程的细节
4 Java中的线程和Fiber
线程是由os实现的,而Fiber(或用户模式线程)则在用户模式下实现。
简单来说,Fiber也是线程,即我们可以生成并与其他线程同步的顺序进程。不过,通常我们提到“线程”时是指由os实现的那些线程,而Fiber(有时称为轻量级线程或用户模式线程)则是在用户模式下实现的。
5 啥是 Quasar Fiber?
Quasar 是一个便于在 Java 中进行并发编程的轻量级线程库。
Quasar 将Fiber和线程抽象为一个统一的线,使Fiber和线程可以无缝协作。Quasar Fiber的实现方式与os线程类似,但它们是用 JVM 字节码而不是os内核实现的。
为啥用 Quasar Fiber?
os线程会带来较大的性能开销:在线程之间切换时,需要在用户模式和内核模式之间来回切换,甚至有时还会跨越地址空间边界。这些操作非常昂贵,部分原因在于它们会导致 TLB 刷新、缓存未命中和 CPU 管道混乱:这也是为什么陷阱和系统调用比普通的过程调用慢许多倍。
此外,内核使用通用调度算法为线程分配 CPU 核心,这种算法可能会处理各类线程,从只处理一个事务的线程到处理完整视频播放的线程。
6 啥时在 Java 中使用Fiber?
由于Fiber是在应用层调度的,它们可以使用更适合自身使用场景的调度程序。大多数Fiber用于处理事务,因此它们的活动时间非常短,并且经常被阻塞。Fiber的行为通常是被 I/O 或其他Fiber唤醒,运行一个简短的处理周期,然后将控制权转移给另一个Fiber(通过队列或其他同步机制)。这种行为最适合使用称为“工作窃取”的调度算法;这种调度算法被 Erlang、Go 和 Quasar(默认情况下)使用。当Fiber以这种方式运行时,工作窃取能够在Fiber之间切换时最小化缓存未命中。
内核可能成为高并发的瓶颈。假设线程切换的速度与普通过程调用一样快,并且我们可以避免为线程维护内核数据结构:那么我们可以在内存占用和切换效率方面获得巨大提升。
JVM Fiber性能如何?
管理Fiber的用户模式堆栈确实会带来一些开销;具体开销取决于插桩方法的调用频率以及Fiber调用堆栈的深度。如像 Comsat 这样的 Quasar 集成通常基于 FiberAsync 类,它会在调用异步 API 后挂起Fiber,并在完成回调时恢复Fiber。在这种情况下,堆栈非常浅,调用频率也很低,因为Fiber主要用于执行 I/O 操作(I/O 操作比方法调用慢很多倍)。
这篇基准分析 表明,与线程相比,使用Fiber处理 HTTP 请求显著提高了服务器的 容量,并使其更具弹性。我们的经验表明,Quasar Fiber在许多具体场景下表现良好:它们允许你编写简单的Fiber阻塞代码,同时开发高度并发且细粒度的系统,这些系统无法在笨重的操作系统线程上运行。
即便与异步和单子 API 相比,Fiber的开销也非常低。异步和单子 API 不仅带来了繁琐且具传染性的编程风格,还无法与语言内置的命令式控制流结构很好地协作。
那JVM Fiber是不是生成器或 async/await?
不,正如之前讨论,Fiber是真正的线程:即一个续延加上一个调度器。生成器和 async/await 是通过续延实现的(通常是一个更有限的续延形式,称为 无栈,它只能捕获单个堆栈帧),但这些续延没有调度器,因此它们不是线程。
7 最终想法
不要让关于Fiber和线程的讨论止步于性能改进。JRebel 可以跳过重新部署和重建,同时保持应用状态。这样开发者可以即时检查代码更改的效果,从而保持开发节奏。