Java 中线程和纤程Fiber的区别是什么?

本文涉及的产品
NLP自然语言处理_基础版,每接口每天50万次
视觉智能开放平台,分割抠图1万点
视觉智能开放平台,图像资源包5000点
简介: 【10月更文挑战第14天】

0 前言

线程和Fiber通常会一起讨论,但它们有各自不同使用场景和性能考虑。

线程和Fiber在抽象和实现上基本相同,主要区别在于使用场景:

  • os线程可用于任何语言,但需要大量RAM,且在同步和生成时较慢
  • 而Fiber则特定于某个语言或运行时,十分轻量,且同步时几乎没有额外开销
  • 虚拟线程随 Java 21 成为永久功能,解决了传统线程的一些性能限制,以最大化硬件性能

1 啥是 Java 中的线程?

线程是由调度程序安排在适当时间运行于 CPU 核心上的续延。续延简单来说就是程序计数器,它标记了我们在指令序列中的位置,以及一个堆栈,用于存储变量的值。

os会看到并使用硬件运行时:包括 CPU、应用数据寄存器、代码寄存器(即程序计数器)、内存寄存器(如堆栈指针)、虚拟内存和 CPU 模式。特别是,当发生陷阱事件或执行系统调用时,CPU可在受限的用户模式和功能更强大的内核模式之间切换。os线程共享大多数内核资源(如 I/O 描述符),且位于同一地址空间:这使得它们比多个单线程os进程更轻,同时允许它们共享数据。但它们不共享 CPU 寄存器,且拥有各自的堆栈,这使它们能并发执行不同的控制流。

2 JVM 线程与调度

线程数量可能超过可用的处理器,因此os需通过调度将它们在 CPU 上切换。调度事件可由抢占事件触发(当线程耗尽它的 CPU 配额时)或代码显式调用系统调用陷阱(如执行内核例程,如 I/O)。CPU会切换到内核模式,并将执行转移到包含陷阱处理程序的特殊内存区域:此时内核可以快照 CPU 寄存器,包括程序计数器和线程堆栈指针,并将它们打包到一个 线程控制块 续延中。

之后,调度程序被调用以选择下一个要运行的线程,可能是在不同的进程中;然后内核恢复所有相关的 CPU 寄存器,并设置处理器切换回用户模式,在恢复的程序计数器地址继续执行。

3 啥是虚拟线程?

虚拟线程是轻量级线程,简化了编写和维护具有高计算要求的并发应用程序的过程。

传统的os线程非常笨重。而虚拟线程则将线程调度的责任从os转移到 JVM,有效地在操作系统和应用程序之间引入了一个抽象层。虚拟线程随 JDK 21 成为永久功能,克服了传统线程的一些性能限制,以最大化硬件性能。

📚 进一步阅读: 深入了解虚拟线程的细节

4 Java中的线程和Fiber

线程是由os实现的,而Fiber(或用户模式线程)则在用户模式下实现。

简单来说,Fiber也是线程,即我们可以生成并与其他线程同步的顺序进程。不过,通常我们提到“线程”时是指由os实现的那些线程,而Fiber(有时称为轻量级线程或用户模式线程)则是在用户模式下实现的。

5 啥是 Quasar Fiber?

Quasar 是一个便于在 Java 中进行并发编程的轻量级线程库。

Quasar 将Fiber和线程抽象为一个统一的线,使Fiber和线程可以无缝协作。Quasar Fiber的实现方式与os线程类似,但它们是用 JVM 字节码而不是os内核实现的。

为啥用 Quasar Fiber?

os线程会带来较大的性能开销:在线程之间切换时,需要在用户模式和内核模式之间来回切换,甚至有时还会跨越地址空间边界。这些操作非常昂贵,部分原因在于它们会导致 TLB 刷新、缓存未命中和 CPU 管道混乱:这也是为什么陷阱和系统调用比普通的过程调用慢许多倍。

此外,内核使用通用调度算法为线程分配 CPU 核心,这种算法可能会处理各类线程,从只处理一个事务的线程到处理完整视频播放的线程。

6 啥时在 Java 中使用Fiber?

由于Fiber是在应用层调度的,它们可以使用更适合自身使用场景的调度程序。大多数Fiber用于处理事务,因此它们的活动时间非常短,并且经常被阻塞。Fiber的行为通常是被 I/O 或其他Fiber唤醒,运行一个简短的处理周期,然后将控制权转移给另一个Fiber(通过队列或其他同步机制)。这种行为最适合使用称为“工作窃取”的调度算法;这种调度算法被 Erlang、Go 和 Quasar(默认情况下)使用。当Fiber以这种方式运行时,工作窃取能够在Fiber之间切换时最小化缓存未命中。

内核可能成为高并发的瓶颈。假设线程切换的速度与普通过程调用一样快,并且我们可以避免为线程维护内核数据结构:那么我们可以在内存占用和切换效率方面获得巨大提升。

JVM Fiber性能如何?

管理Fiber的用户模式堆栈确实会带来一些开销;具体开销取决于插桩方法的调用频率以及Fiber调用堆栈的深度。如像 Comsat 这样的 Quasar 集成通常基于 FiberAsync 类,它会在调用异步 API 后挂起Fiber,并在完成回调时恢复Fiber。在这种情况下,堆栈非常浅,调用频率也很低,因为Fiber主要用于执行 I/O 操作(I/O 操作比方法调用慢很多倍)。

这篇基准分析 表明,与线程相比,使用Fiber处理 HTTP 请求显著提高了服务器的 容量,并使其更具弹性。我们的经验表明,Quasar Fiber在许多具体场景下表现良好:它们允许你编写简单的Fiber阻塞代码,同时开发高度并发且细粒度的系统,这些系统无法在笨重的操作系统线程上运行。

即便与异步和单子 API 相比,Fiber的开销也非常低。异步和单子 API 不仅带来了繁琐且具传染性的编程风格,还无法与语言内置的命令式控制流结构很好地协作。

那JVM Fiber是不是生成器或 async/await?

不,正如之前讨论,Fiber是真正的线程:即一个续延加上一个调度器。生成器和 async/await 是通过续延实现的(通常是一个更有限的续延形式,称为 无栈,它只能捕获单个堆栈帧),但这些续延没有调度器,因此它们不是线程。

7 最终想法

不要让关于Fiber和线程的讨论止步于性能改进。JRebel 可以跳过重新部署和重建,同时保持应用状态。这样开发者可以即时检查代码更改的效果,从而保持开发节奏。

目录
相关文章
|
7天前
|
安全 Java 测试技术
Java并行流陷阱:为什么指定线程池可能是个坏主意
本文探讨了Java并行流的使用陷阱,尤其是指定线程池的问题。文章分析了并行流的设计思想,指出了指定线程池的弊端,并提供了使用CompletableFuture等替代方案。同时,介绍了Parallel Collector库在处理阻塞任务时的优势和特点。
|
3天前
|
安全 Java 开发者
深入解读JAVA多线程:wait()、notify()、notifyAll()的奥秘
在Java多线程编程中,`wait()`、`notify()`和`notifyAll()`方法是实现线程间通信和同步的关键机制。这些方法定义在`java.lang.Object`类中,每个Java对象都可以作为线程间通信的媒介。本文将详细解析这三个方法的使用方法和最佳实践,帮助开发者更高效地进行多线程编程。 示例代码展示了如何在同步方法中使用这些方法,确保线程安全和高效的通信。
20 9
|
6天前
|
存储 安全 Java
Java多线程编程的艺术:从基础到实践####
本文深入探讨了Java多线程编程的核心概念、应用场景及其实现方式,旨在帮助开发者理解并掌握多线程编程的基本技能。文章首先概述了多线程的重要性和常见挑战,随后详细介绍了Java中创建和管理线程的两种主要方式:继承Thread类与实现Runnable接口。通过实例代码,本文展示了如何正确启动、运行及同步线程,以及如何处理线程间的通信与协作问题。最后,文章总结了多线程编程的最佳实践,为读者在实际项目中应用多线程技术提供了宝贵的参考。 ####
|
3天前
|
监控 安全 Java
Java中的多线程编程:从入门到实践####
本文将深入浅出地探讨Java多线程编程的核心概念、应用场景及实践技巧。不同于传统的摘要形式,本文将以一个简短的代码示例作为开篇,直接展示多线程的魅力,随后再详细解析其背后的原理与实现方式,旨在帮助读者快速理解并掌握Java多线程编程的基本技能。 ```java // 简单的多线程示例:创建两个线程,分别打印不同的消息 public class SimpleMultithreading { public static void main(String[] args) { Thread thread1 = new Thread(() -> System.out.prin
|
6天前
|
Java
JAVA多线程通信:为何wait()与notify()如此重要?
在Java多线程编程中,`wait()` 和 `notify()/notifyAll()` 方法是实现线程间通信的核心机制。它们通过基于锁的方式,使线程在条件不满足时进入休眠状态,并在条件满足时被唤醒,从而确保数据一致性和同步。相比其他通信方式,如忙等待,这些方法更高效灵活。 示例代码展示了如何在生产者-消费者模型中使用这些方法实现线程间的协调和同步。
18 3
|
5天前
|
安全 Java
Java多线程集合类
本文介绍了Java中线程安全的问题及解决方案。通过示例代码展示了使用`CopyOnWriteArrayList`、`CopyOnWriteArraySet`和`ConcurrentHashMap`来解决多线程环境下集合操作的线程安全问题。这些类通过不同的机制确保了线程安全,提高了并发性能。
|
6天前
|
Java
java小知识—进程和线程
进程 进程是程序的一次执行过程,是系统运行的基本单位,因此进程是动态的。系统运行一个程序即是一个进程从创建,运行到消亡的过程。简单来说,一个进程就是一个执行中的程序,它在计算机中一个指令接着一个指令地执行着,同时,每个进程还占有某些系统资源如CPU时间,内存空间,文件,文件,输入输出设备的使用权等等。换句话说,当程序在执行时,将会被操作系统载入内存中。 线程 线程,与进程相似,但线程是一个比进程更小的执行单位。一个进程在其执行的过程中产生多个线程。与进程不同的是同类的多个线程共享同一块内存空间和一组系统资源,所以系统在产生一个线程,或是在各个线程之间做切换工作时,负担要比
16 1
|
6天前
|
Java UED
Java中的多线程编程基础与实践
【10月更文挑战第35天】在Java的世界中,多线程是提升应用性能和响应性的利器。本文将深入浅出地介绍如何在Java中创建和管理线程,以及如何利用同步机制确保数据一致性。我们将从简单的“Hello, World!”线程示例出发,逐步探索线程池的高效使用,并讨论常见的多线程问题。无论你是Java新手还是希望深化理解,这篇文章都将为你打开多线程的大门。
|
6天前
|
安全 Java 编译器
Java多线程编程的陷阱与最佳实践####
【10月更文挑战第29天】 本文深入探讨了Java多线程编程中的常见陷阱,如竞态条件、死锁、内存一致性错误等,并通过实例分析揭示了这些陷阱的成因。同时,文章也分享了一系列最佳实践,包括使用volatile关键字、原子类、线程安全集合以及并发框架(如java.util.concurrent包下的工具类),帮助开发者有效避免多线程编程中的问题,提升应用的稳定性和性能。 ####
30 1
|
10天前
|
存储 设计模式 分布式计算
Java中的多线程编程:并发与并行的深度解析####
在当今软件开发领域,多线程编程已成为提升应用性能、响应速度及资源利用率的关键手段之一。本文将深入探讨Java平台上的多线程机制,从基础概念到高级应用,全面解析并发与并行编程的核心理念、实现方式及其在实际项目中的应用策略。不同于常规摘要的简洁概述,本文旨在通过详尽的技术剖析,为读者构建一个系统化的多线程知识框架,辅以生动实例,让抽象概念具体化,复杂问题简单化。 ####