Java 中线程和纤程Fiber的区别是什么?

简介: 【10月更文挑战第14天】

0 前言

线程和Fiber通常会一起讨论,但它们有各自不同使用场景和性能考虑。

线程和Fiber在抽象和实现上基本相同,主要区别在于使用场景:

  • os线程可用于任何语言,但需要大量RAM,且在同步和生成时较慢
  • 而Fiber则特定于某个语言或运行时,十分轻量,且同步时几乎没有额外开销
  • 虚拟线程随 Java 21 成为永久功能,解决了传统线程的一些性能限制,以最大化硬件性能

1 啥是 Java 中的线程?

线程是由调度程序安排在适当时间运行于 CPU 核心上的续延。续延简单来说就是程序计数器,它标记了我们在指令序列中的位置,以及一个堆栈,用于存储变量的值。

os会看到并使用硬件运行时:包括 CPU、应用数据寄存器、代码寄存器(即程序计数器)、内存寄存器(如堆栈指针)、虚拟内存和 CPU 模式。特别是,当发生陷阱事件或执行系统调用时,CPU可在受限的用户模式和功能更强大的内核模式之间切换。os线程共享大多数内核资源(如 I/O 描述符),且位于同一地址空间:这使得它们比多个单线程os进程更轻,同时允许它们共享数据。但它们不共享 CPU 寄存器,且拥有各自的堆栈,这使它们能并发执行不同的控制流。

2 JVM 线程与调度

线程数量可能超过可用的处理器,因此os需通过调度将它们在 CPU 上切换。调度事件可由抢占事件触发(当线程耗尽它的 CPU 配额时)或代码显式调用系统调用陷阱(如执行内核例程,如 I/O)。CPU会切换到内核模式,并将执行转移到包含陷阱处理程序的特殊内存区域:此时内核可以快照 CPU 寄存器,包括程序计数器和线程堆栈指针,并将它们打包到一个 线程控制块 续延中。

之后,调度程序被调用以选择下一个要运行的线程,可能是在不同的进程中;然后内核恢复所有相关的 CPU 寄存器,并设置处理器切换回用户模式,在恢复的程序计数器地址继续执行。

3 啥是虚拟线程?

虚拟线程是轻量级线程,简化了编写和维护具有高计算要求的并发应用程序的过程。

传统的os线程非常笨重。而虚拟线程则将线程调度的责任从os转移到 JVM,有效地在操作系统和应用程序之间引入了一个抽象层。虚拟线程随 JDK 21 成为永久功能,克服了传统线程的一些性能限制,以最大化硬件性能。

📚 进一步阅读: 深入了解虚拟线程的细节

4 Java中的线程和Fiber

线程是由os实现的,而Fiber(或用户模式线程)则在用户模式下实现。

简单来说,Fiber也是线程,即我们可以生成并与其他线程同步的顺序进程。不过,通常我们提到“线程”时是指由os实现的那些线程,而Fiber(有时称为轻量级线程或用户模式线程)则是在用户模式下实现的。

5 啥是 Quasar Fiber?

Quasar 是一个便于在 Java 中进行并发编程的轻量级线程库。

Quasar 将Fiber和线程抽象为一个统一的线,使Fiber和线程可以无缝协作。Quasar Fiber的实现方式与os线程类似,但它们是用 JVM 字节码而不是os内核实现的。

为啥用 Quasar Fiber?

os线程会带来较大的性能开销:在线程之间切换时,需要在用户模式和内核模式之间来回切换,甚至有时还会跨越地址空间边界。这些操作非常昂贵,部分原因在于它们会导致 TLB 刷新、缓存未命中和 CPU 管道混乱:这也是为什么陷阱和系统调用比普通的过程调用慢许多倍。

此外,内核使用通用调度算法为线程分配 CPU 核心,这种算法可能会处理各类线程,从只处理一个事务的线程到处理完整视频播放的线程。

6 啥时在 Java 中使用Fiber?

由于Fiber是在应用层调度的,它们可以使用更适合自身使用场景的调度程序。大多数Fiber用于处理事务,因此它们的活动时间非常短,并且经常被阻塞。Fiber的行为通常是被 I/O 或其他Fiber唤醒,运行一个简短的处理周期,然后将控制权转移给另一个Fiber(通过队列或其他同步机制)。这种行为最适合使用称为“工作窃取”的调度算法;这种调度算法被 Erlang、Go 和 Quasar(默认情况下)使用。当Fiber以这种方式运行时,工作窃取能够在Fiber之间切换时最小化缓存未命中。

内核可能成为高并发的瓶颈。假设线程切换的速度与普通过程调用一样快,并且我们可以避免为线程维护内核数据结构:那么我们可以在内存占用和切换效率方面获得巨大提升。

JVM Fiber性能如何?

管理Fiber的用户模式堆栈确实会带来一些开销;具体开销取决于插桩方法的调用频率以及Fiber调用堆栈的深度。如像 Comsat 这样的 Quasar 集成通常基于 FiberAsync 类,它会在调用异步 API 后挂起Fiber,并在完成回调时恢复Fiber。在这种情况下,堆栈非常浅,调用频率也很低,因为Fiber主要用于执行 I/O 操作(I/O 操作比方法调用慢很多倍)。

这篇基准分析 表明,与线程相比,使用Fiber处理 HTTP 请求显著提高了服务器的 容量,并使其更具弹性。我们的经验表明,Quasar Fiber在许多具体场景下表现良好:它们允许你编写简单的Fiber阻塞代码,同时开发高度并发且细粒度的系统,这些系统无法在笨重的操作系统线程上运行。

即便与异步和单子 API 相比,Fiber的开销也非常低。异步和单子 API 不仅带来了繁琐且具传染性的编程风格,还无法与语言内置的命令式控制流结构很好地协作。

那JVM Fiber是不是生成器或 async/await?

不,正如之前讨论,Fiber是真正的线程:即一个续延加上一个调度器。生成器和 async/await 是通过续延实现的(通常是一个更有限的续延形式,称为 无栈,它只能捕获单个堆栈帧),但这些续延没有调度器,因此它们不是线程。

7 最终想法

不要让关于Fiber和线程的讨论止步于性能改进。JRebel 可以跳过重新部署和重建,同时保持应用状态。这样开发者可以即时检查代码更改的效果,从而保持开发节奏。

目录
相关文章
|
4月前
|
JSON 网络协议 安全
【Java】(10)进程与线程的关系、Tread类;讲解基本线程安全、网络编程内容;JSON序列化与反序列化
几乎所有的操作系统都支持进程的概念,进程是处于运行过程中的程序,并且具有一定的独立功能,进程是系统进行资源分配和调度的一个独立单位一般而言,进程包含如下三个特征。独立性动态性并发性。
252 1
|
4月前
|
JSON 网络协议 安全
【Java基础】(1)进程与线程的关系、Tread类;讲解基本线程安全、网络编程内容;JSON序列化与反序列化
几乎所有的操作系统都支持进程的概念,进程是处于运行过程中的程序,并且具有一定的独立功能,进程是系统进行资源分配和调度的一个独立单位一般而言,进程包含如下三个特征。独立性动态性并发性。
268 1
|
5月前
|
数据采集 存储 弹性计算
高并发Java爬虫的瓶颈分析与动态线程优化方案
高并发Java爬虫的瓶颈分析与动态线程优化方案
|
5月前
|
安全 Java API
Java SE 与 Java EE 区别解析及应用场景对比
在Java编程世界中,Java SE(Java Standard Edition)和Java EE(Java Enterprise Edition)是两个重要的平台版本,它们各自有着独特的定位和应用场景。理解它们之间的差异,对于开发者选择合适的技术栈进行项目开发至关重要。
766 1
Java 数据库 Spring
224 0
|
5月前
|
算法 Java
Java多线程编程:实现线程间数据共享机制
以上就是Java中几种主要处理多线程序列化资源以及协调各自独立运行但需相互配合以完成任务threads 的技术手段与策略。正确应用上述技术将大大增强你程序稳定性与效率同时也降低bug出现率因此深刻理解每项技术背后理论至关重要.
414 16
|
6月前
|
缓存 并行计算 安全
关于Java多线程详解
本文深入讲解Java多线程编程,涵盖基础概念、线程创建与管理、同步机制、并发工具类、线程池、线程安全集合、实战案例及常见问题解决方案,助你掌握高性能并发编程技巧,应对多线程开发中的挑战。
|
6月前
|
Java 测试技术
Java浮点类型详解:使用与区别
Java中的浮点类型主要包括float和double,它们在内存占用、精度范围和使用场景上有显著差异。float占用4字节,提供约6-7位有效数字;double占用8字节,提供约15-16位有效数字。float适合内存敏感或精度要求不高的场景,而double精度更高,是Java默认的浮点类型,推荐在大多数情况下使用。两者都存在精度限制,不能用于需要精确计算的金融领域。比较浮点数时应使用误差范围或BigDecimal类。科学计算和工程计算通常使用double,而金融计算应使用BigDecimal。
2510 102
|
6月前
|
数据采集 存储 前端开发
Java爬虫性能优化:多线程抓取JSP动态数据实践
Java爬虫性能优化:多线程抓取JSP动态数据实践
|
7月前
|
存储 缓存 人工智能
Java int和Integer的区别
本文介绍了Java中int与Integer的区别及==与equals的比较机制。Integer是int的包装类,支持null值。使用==比较时,int直接比较数值,而Integer比较对象地址;在-128至127范围内的Integer值可缓存,超出该范围或使用new创建时则返回不同对象。equals方法则始终比较实际数值。
251 0

热门文章

最新文章