Java 线程池之ThreadPoolExecutor学习总结

简介: Java 线程池之ThreadPoolExecutor学习总结

前提

java version "1.8.0_25"

池简述

软件开发活动中,我们经常会听到数据库连接池、内存池、线程池等各种“池”概念,这些“池”到底是什么东西呢?程序的世界里,我们可以将池简单的理解为一种容器类数据结构,比如列表。程序处理信息的过程中,可能会依赖某些资源或者对象(暂且统一称之为对象),比如数据库连接,来执行一些高频操作,比如数据表查询,此时,如果被依赖对象的存活时间比较短,那就意味着需要频繁的创建和销毁对象,这可能会很耗时、耗系统资源(CPU、内存、磁盘、网络等)。为了解决这个问题,进行程序设计时,可能会考虑在程序初始化时,预先创建一批所需对象,并存储到池中,或者根据需要即时创建对象,并在使用完成后,将对象添加到池中,这样,当程序需要(再次)使用对象时,可以直接从池中直接获取现有的对象,节省了频繁创建和销毁对象带来的资源浪费,这就是池的作用,为程序提供复用对象或者提前分配资源的能力。

ThreadPoolExecutor线程池介绍

下文仅针对线程池的一些要点做介绍

任务处理流程

核心线程池大小(corePoolSize)和最大线程池大小(maximumPoolSize)

ThreadPoolExecutor会根据corePoolSize(保持存活(不允许超时退出等)的最小工作线程数,如果设置了allowCoreThreadTimeOuttrue,则该值为0。可通过getPoolSize方法获取该值) 和maximumPoolSize(线程池中允许的最大线程数,可通过getMaximumPoolSize获取该值)设置的界限自动调整线程池的大小。

当通过execute(Runnable) 方法提交新任务后,如果正在运行的线程的数量小于corePoolSize,则创建新线程来处理请求,即使存在其它空闲的工作线程,否则如果正在运行的线程的数量大于corePoolSize,但小于maximumPoolSize,则仅仅在队列已经满时才会创建新线程来处理请求。设置corePoolSize等于maximumPoolSize则表示创建一个固定大小的线程池。

通过设置maximumPoolSize为基本无界的值,例如Integer.MAX_VALUE,则允许线程池容纳任意并发任务数。大多数情况下,corePoolSizemaximumPoolSize仅在构建时设置,但也可以分别用使用setCorePoolSizesetMaximumPoolSize对其进行动态更改。

按需创建线程

默认情况下,仅在新任务到达时创建和启动线程,即便是核心线程。可以使用prestartCoreThread或者prestartAllCoreThreads对此进行动态更改。如果使用非空队列构造线程池,你可能会想预先启动线程。

创建新线程

使用ThreadFactory创建新线程。如果未指定,则使用Executors.defaultThreadFactory,其创建的线程都位于相同线程组,且拥有相同的优先级NORM_PRIORITY以及非守护状态。通过提供不同的线程工程ThreadFactory,可以修改线程的名称,线程组,优先级,守护状态等等。当newThread返回null时,ThreadFactory将无法创建线程,此时执行器继续运行,但是可能无法执行任何任务。线程应该拥有modifyThreadRuntimePermission。如果工作线程或者其它线程使用不具有该权限的线程池,服务可能被降级:配置变更可能不会及时生效,且关闭线程池可能会保留终止但未完成的状态。

线程保持存活时间

如果线程池当前拥有多于corePoolSize数量的线程,则空闲时间超过keepAliveTime(可通过getKeepAliveTime(TimeUnit)方法获取)的线程将被终止,以减少资源消耗。可以通过setKeepAliveTime(long,TimeUnit)方法动态改变该参数值。使用setKeepAliveTime(Long.MAX_VALUE, NANOSECONDS)可以有效的阻止空闲线程在关闭之前终止。默认情况下,keep-alive策略仅在线程池中线程数多余corePoolSize时起作用。keepAliveTime的值不为0的情况下,可通过allowCoreThreadTimeOut(boolean)方法将keep-alive策略应用于核心线程。

排队(Queuing)

BlockingQueue用于传输和容纳提交的任务。此队列的使用与线程池大小变化相关:

  • 如果线程池中当前线程数少于corePoolSize,那么Executor总是优先创建新线程来处理任务请求,而不是让任务请求排队
  • 如果线程池中当前线程数等于或者多余corePoolSize,那么Executor总是优先让任务排队,而不是创建新线程
  • 如果无法让任务请求排队(比如任务队列已满),且线程池中当前线程数未超过maximumPoolSize,则创建一个新线程来处理任务请求,否则将拒绝该任务请求

三种排队策略:

  • 直接传递(Direct handoffs)
    SynchronousQueue是工作队列(workQueue)的一个默认好选择。它将任务交给线程,而不是保留它们。此时,如果没有立即可用的线程,将构造新线程,因为让任务排队的尝试将会失败。此策略在处理可能具有内部依赖关系的请求集时避免锁定。通常需要无界的maximumPoolSize,以避免拒绝新任务的提交。这反过来说明当任务平均提交速度持续大于平均处理速度时,线程数无限增长的可能性。如果使用newCachedThreadPool创建线程池则表示使用直接传递策略
  • 无界队列(Unbounded queues)
    当所有核心线程都繁忙时,使用无界队列(例如,没有预定义容量的LinkedBlockingQueue)将导致新任务在队列中等待,从而导致没有多余corePoolSize的线程被创建(maximumPoolSize的值不起任何作用)。当每个任务完全彼此独立,互不影响执行时,这可能是合适的。例如,在网页服务器中, 这种排队方式用于平滑瞬时大量请求时很有用。需要注意的是,当任务平均提交速度持续大于平均处理速度时,可能会导致无界队列无限增长。如果使用newFixedThreadPool 创建线程池则表示使用无界队列。
  • 有界队列(Bounded queues)
    有界队列(例如,ArrayBlockingQueue)配合maximumPoolSizes使用有助于防止资源耗尽,但是难以调整和控制。队列大小和最大线程池大小需要相互权衡:使用大队列和较小的线程池可以最大限度地减少CPU使用率,操作系统资源和上下文切换开销,但是会导致人为的低吞吐量。如果任务频繁被阻塞(比如I/O限制),那么系统可以调度比我们允许的更多的线程。使用小队列通常需要较大的线程池,这会让CPU保持繁忙,但可能会产生不可接受的调度开销,这也会降低吞吐量。

拒绝处理任务

Executor已关闭、使用有界的线程池、工作队列,且达到最大值时,通过方法execute(Runnable)提交的任务将被拒绝。在任何一种情况下,execute方法调用其RejectedExecutionHandlerrejectedExecution(Runnable,ThreadPoolExecutor)方法。提供以下4种预定义处理策略:

ThreadPoolExecutor.AbortPolicy(默认策略)

拒绝任务时,处理器会抛出一个运行时异常RejectedExecutionException

ThreadPoolExecutor.CallerRunsPolicy

调用execute的线程自己运行任务。这提供了一个简单的反馈控制机制,将会降低新任务提交的速率。

ThreadPoolExecutor.DiscardPolicy

不能被执行的任务将被抛弃

ThreadPoolExecutor.DiscardOldestPolicy

如果Executor已关闭,工作队列队首的任务被丢弃,然后重试执行。(重试也可能失败,导致重复执行前面的动作)

可以定义和使用其他类型的RejectedExecutionHandler类。这样做需要一些谨慎,特别是当策略被设计为仅在特定容量或者队列策略下有效时

线程运行状态

该线程池使用了一个runState来对线程进行主要生命周期控制,具有以下值:

RUNNING: 接收新任务并且处理排队的任务

SHUTDOWN: 不接收新任务,但是处理排队的任务。

STOP: 不接收新任务,不处理排队的任务,并且中断正在进行的任务。

TIDYING: 所有任务已终止。workerCount为0。线程转为TIDYING状态将会运行terminated() hook方法。

TERMINATED: terminated()已经运行完。

这些值之间的数字顺序很重要,为了支持有序比较,runState会随着时间单调递增,但不需要达到每个状态。

状态转换如下:

RUNNING -> SHUTDOWN

调用shutdown()时,可能隐式的在finalize()中调用

RUNNING 或者 SHUTDOWN -> STOP

调用shutdownNow()

SHUTDOWN -> TIDYING

当工作队列和线程池都为空时

STOP -> TIDYING

线程池为空时

TIDYING -> TERMINATED

terminated() hook方法运行完成时。

线程的析构(Finalization)

如果线程池不再被程序引用且没有剩余的线程,线程池将被关闭。如果希望确保未被引用的线程池被回收,即使用户用户忘记调用shutdown,则必须通过适当的keep-alive配置,使用更低的下限--0核心线程数或者设置allowCoreThreadTimeOut(boolean),确保未使用的线程最终会消亡。

目录
相关文章
|
4天前
|
Java 数据库
【Java多线程】对线程池的理解并模拟实现线程池
【Java多线程】对线程池的理解并模拟实现线程池
13 1
|
13天前
|
Java
Java并发编程:深入理解线程池
【4月更文挑战第30天】本文将深入探讨Java并发编程中的一个重要主题——线程池。我们将从线程池的基本概念入手,了解其工作原理和优势,然后详细介绍如何使用Java的Executor框架创建和管理线程池。最后,我们将讨论一些高级主题,如自定义线程工厂和拒绝策略。通过本文的学习,你将能够更好地理解和使用Java的线程池,提高你的并发编程能力。
|
1天前
|
Java 调度
Java一分钟之线程池:ExecutorService与Future
【5月更文挑战第12天】Java并发编程中,`ExecutorService`和`Future`是关键组件,简化多线程并提供异步执行能力。`ExecutorService`是线程池接口,用于提交任务到线程池,如`ThreadPoolExecutor`和`ScheduledThreadPoolExecutor`。通过`submit()`提交任务并返回`Future`对象,可检查任务状态、获取结果或取消任务。注意处理`ExecutionException`和避免无限等待。实战示例展示了如何异步执行任务并获取结果。理解这些概念对提升并发性能至关重要。
15 5
|
1天前
|
存储 算法 搜索推荐
滚雪球学Java(27):从零开始学习数组:定义和初始化
【5月更文挑战第2天】🏆本文收录于「滚雪球学Java」专栏,专业攻坚指数级提升,希望能够助你一臂之力,帮你早日登顶实现财富自由🚀;同时,欢迎大家关注&&收藏&&订阅!持续更新中,up!up!up!!
7 3
|
2天前
|
Java 调度
Java并发编程:深入理解线程池
【5月更文挑战第11天】本文将深入探讨Java中的线程池,包括其基本概念、工作原理以及如何使用。我们将通过实例来解释线程池的优点,如提高性能和资源利用率,以及如何避免常见的并发问题。我们还将讨论Java中线程池的实现,包括Executor框架和ThreadPoolExecutor类,并展示如何创建和管理线程池。最后,我们将讨论线程池的一些高级特性,如任务调度、线程优先级和异常处理。
|
3天前
|
缓存 Java 数据库
Java并发编程学习11-任务执行演示
【5月更文挑战第4天】本篇将结合任务执行和 Executor 框架的基础知识,演示一些不同版本的任务执行Demo,并且每个版本都实现了不同程度的并发性。
24 4
Java并发编程学习11-任务执行演示
|
4天前
|
数据库连接
java+ssm+vue代码视频学习讲解
java+ssm+vue代码视频学习讲解
6 0
|
6天前
|
缓存 Java
Java并发编程:深入理解线程池
【5月更文挑战第7天】本文将深入探讨Java并发编程中的重要概念——线程池。我们将了解线程池的基本概念,以及如何使用Java的Executor框架来创建和管理线程池。此外,我们还将讨论线程池的优点和缺点,以及如何选择合适的线程池大小。最后,我们将通过一个示例来演示如何使用线程池来提高程序的性能。
|
12天前
|
缓存 Java 调度
Java并发编程:深入理解线程池
【4月更文挑战第30天】 在Java并发编程中,线程池是一种重要的工具,它可以帮助我们有效地管理线程,提高系统性能。本文将深入探讨Java线程池的工作原理,如何使用它,以及如何根据实际需求选择合适的线程池策略。
|
13天前
|
Java
Java并发编程:深入理解线程池
【4月更文挑战第30天】 本文将深入探讨Java中的线程池,解析其原理、使用场景以及如何合理地利用线程池提高程序性能。我们将从线程池的基本概念出发,介绍其内部工作机制,然后通过实例演示如何创建和使用线程池。最后,我们将讨论线程池的优缺点以及在实际应用中需要注意的问题。