Java 线程池之ThreadPoolExecutor学习总结

2023-04-22 119

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： Java 线程池之ThreadPoolExecutor学习总结

前提

java version "1.8.0_25"

池简述

软件开发活动中，我们经常会听到数据库连接池、内存池、线程池等各种“池”概念，这些“池”到底是什么东西呢？程序的世界里，我们可以将池简单的理解为一种容器类数据结构，比如列表。程序处理信息的过程中，可能会依赖某些资源或者对象(暂且统一称之为对象)，比如数据库连接，来执行一些高频操作，比如数据表查询，此时，如果被依赖对象的存活时间比较短，那就意味着需要频繁的创建和销毁对象，这可能会很耗时、耗系统资源(CPU、内存、磁盘、网络等)。为了解决这个问题，进行程序设计时，可能会考虑在程序初始化时，预先创建一批所需对象，并存储到池中，或者根据需要即时创建对象，并在使用完成后，将对象添加到池中，这样，当程序需要(再次)使用对象时，可以直接从池中直接获取现有的对象，节省了频繁创建和销毁对象带来的资源浪费，这就是池的作用，为程序提供复用对象或者提前分配资源的能力。

ThreadPoolExecutor线程池介绍

下文仅针对线程池的一些要点做介绍

任务处理流程

核心线程池大小(`corePoolSize`)和最大线程池大小(`maximumPoolSize`)

ThreadPoolExecutor会根据corePoolSize(保持存活(不允许超时退出等)的最小工作线程数，如果设置了allowCoreThreadTimeOut为true，则该值为0。可通过getPoolSize方法获取该值) 和maximumPoolSize(线程池中允许的最大线程数，可通过getMaximumPoolSize获取该值)设置的界限自动调整线程池的大小。

当通过execute(Runnable) 方法提交新任务后，如果正在运行的线程的数量小于corePoolSize，则创建新线程来处理请求，即使存在其它空闲的工作线程，否则如果正在运行的线程的数量大于corePoolSize，但小于maximumPoolSize，则仅仅在队列已经满时才会创建新线程来处理请求。设置corePoolSize等于maximumPoolSize则表示创建一个固定大小的线程池。

通过设置maximumPoolSize为基本无界的值，例如Integer.MAX_VALUE，则允许线程池容纳任意并发任务数。大多数情况下，corePoolSize和maximumPoolSize仅在构建时设置，但也可以分别用使用setCorePoolSize和setMaximumPoolSize对其进行动态更改。

按需创建线程

默认情况下，仅在新任务到达时创建和启动线程，即便是核心线程。可以使用prestartCoreThread或者prestartAllCoreThreads对此进行动态更改。如果使用非空队列构造线程池，你可能会想预先启动线程。

创建新线程

使用ThreadFactory创建新线程。如果未指定，则使用Executors.defaultThreadFactory，其创建的线程都位于相同线程组，且拥有相同的优先级NORM_PRIORITY以及非守护状态。通过提供不同的线程工程ThreadFactory，可以修改线程的名称，线程组，优先级，守护状态等等。当newThread返回null时，ThreadFactory将无法创建线程，此时执行器继续运行，但是可能无法执行任何任务。线程应该拥有modifyThreadRuntimePermission。如果工作线程或者其它线程使用不具有该权限的线程池，服务可能被降级：配置变更可能不会及时生效，且关闭线程池可能会保留终止但未完成的状态。

线程保持存活时间

如果线程池当前拥有多于corePoolSize数量的线程，则空闲时间超过keepAliveTime(可通过getKeepAliveTime(TimeUnit)方法获取)的线程将被终止，以减少资源消耗。可以通过setKeepAliveTime(long,TimeUnit)方法动态改变该参数值。使用setKeepAliveTime(Long.MAX_VALUE, NANOSECONDS)可以有效的阻止空闲线程在关闭之前终止。默认情况下，keep-alive策略仅在线程池中线程数多余corePoolSize时起作用。keepAliveTime的值不为0的情况下，可通过allowCoreThreadTimeOut(boolean)方法将keep-alive策略应用于核心线程。

排队(Queuing)

BlockingQueue用于传输和容纳提交的任务。此队列的使用与线程池大小变化相关：

如果线程池中当前线程数少于corePoolSize，那么Executor总是优先创建新线程来处理任务请求，而不是让任务请求排队
如果线程池中当前线程数等于或者多余corePoolSize，那么Executor总是优先让任务排队，而不是创建新线程
如果无法让任务请求排队(比如任务队列已满)，且线程池中当前线程数未超过maximumPoolSize，则创建一个新线程来处理任务请求，否则将拒绝该任务请求

三种排队策略：

直接传递(Direct handoffs)
SynchronousQueue是工作队列(workQueue)的一个默认好选择。它将任务交给线程，而不是保留它们。此时，如果没有立即可用的线程，将构造新线程，因为让任务排队的尝试将会失败。此策略在处理可能具有内部依赖关系的请求集时避免锁定。通常需要无界的maximumPoolSize，以避免拒绝新任务的提交。这反过来说明当任务平均提交速度持续大于平均处理速度时，线程数无限增长的可能性。如果使用newCachedThreadPool创建线程池则表示使用直接传递策略
无界队列(Unbounded queues)
当所有核心线程都繁忙时，使用无界队列（例如，没有预定义容量的LinkedBlockingQueue）将导致新任务在队列中等待，从而导致没有多余corePoolSize的线程被创建（maximumPoolSize的值不起任何作用）。当每个任务完全彼此独立，互不影响执行时，这可能是合适的。例如，在网页服务器中，这种排队方式用于平滑瞬时大量请求时很有用。需要注意的是，当任务平均提交速度持续大于平均处理速度时，可能会导致无界队列无限增长。如果使用newFixedThreadPool 创建线程池则表示使用无界队列。
有界队列(Bounded queues)
有界队列（例如，ArrayBlockingQueue）配合maximumPoolSizes使用有助于防止资源耗尽，但是难以调整和控制。队列大小和最大线程池大小需要相互权衡：使用大队列和较小的线程池可以最大限度地减少CPU使用率，操作系统资源和上下文切换开销，但是会导致人为的低吞吐量。如果任务频繁被阻塞（比如I/O限制），那么系统可以调度比我们允许的更多的线程。使用小队列通常需要较大的线程池，这会让CPU保持繁忙，但可能会产生不可接受的调度开销，这也会降低吞吐量。

拒绝处理任务

当Executor已关闭、使用有界的线程池、工作队列，且达到最大值时，通过方法execute(Runnable)提交的任务将被拒绝。在任何一种情况下，execute方法调用其RejectedExecutionHandler的rejectedExecution(Runnable，ThreadPoolExecutor)方法。提供以下4种预定义处理策略：

ThreadPoolExecutor.AbortPolicy（默认策略）

拒绝任务时，处理器会抛出一个运行时异常RejectedExecutionException。

ThreadPoolExecutor.CallerRunsPolicy

调用execute的线程自己运行任务。这提供了一个简单的反馈控制机制，将会降低新任务提交的速率。

ThreadPoolExecutor.DiscardPolicy

不能被执行的任务将被抛弃

ThreadPoolExecutor.DiscardOldestPolicy

如果Executor已关闭，工作队列队首的任务被丢弃，然后重试执行。(重试也可能失败，导致重复执行前面的动作）

可以定义和使用其他类型的RejectedExecutionHandler类。这样做需要一些谨慎，特别是当策略被设计为仅在特定容量或者队列策略下有效时

线程运行状态

该线程池使用了一个runState来对线程进行主要生命周期控制，具有以下值：

RUNNING: 接收新任务并且处理排队的任务

SHUTDOWN: 不接收新任务，但是处理排队的任务。

STOP: 不接收新任务，不处理排队的任务，并且中断正在进行的任务。

TIDYING: 所有任务已终止。workerCount为0。线程转为TIDYING状态将会运行terminated() hook方法。

TERMINATED: terminated()已经运行完。

这些值之间的数字顺序很重要，为了支持有序比较，runState会随着时间单调递增，但不需要达到每个状态。

状态转换如下：

RUNNING -> SHUTDOWN

调用shutdown()时，可能隐式的在finalize()中调用

RUNNING 或者 SHUTDOWN -> STOP

调用shutdownNow()时

SHUTDOWN -> TIDYING

当工作队列和线程池都为空时

STOP -> TIDYING

线程池为空时

TIDYING -> TERMINATED

当terminated() hook方法运行完成时。

线程的析构(Finalization)

如果线程池不再被程序引用且没有剩余的线程，线程池将被关闭。如果希望确保未被引用的线程池被回收，即使用户用户忘记调用shutdown，则必须通过适当的keep-alive配置，使用更低的下限--0核心线程数或者设置allowCoreThreadTimeOut(boolean)，确保未使用的线程最终会消亡。

Java 线程池之ThreadPoolExecutor学习总结

前提

池简述

ThreadPoolExecutor线程池介绍

任务处理流程

核心线程池大小(`corePoolSize`)和最大线程池大小(`maximumPoolSize`)

按需创建线程

创建新线程

线程保持存活时间

排队(Queuing)

拒绝处理任务

线程运行状态

线程的析构(Finalization)

热门文章

最新文章

相关课程

相关电子书

相关实验场景

热门

活动广场

任务中心

开发者评测

高校计划

乘风者计划

训练营

阿里云MVP

话题

直播

下载

镜像站

技术资料

插件

Java 线程池之ThreadPoolExecutor学习总结

前提

池简述

ThreadPoolExecutor线程池介绍

任务处理流程

核心线程池大小(corePoolSize)和最大线程池大小(maximumPoolSize)

按需创建线程

创建新线程

线程保持存活时间

排队(Queuing)

拒绝处理任务

线程运行状态

线程的析构(Finalization)

热门文章

最新文章

相关课程

相关电子书

相关实验场景

核心线程池大小(`corePoolSize`)和最大线程池大小(`maximumPoolSize`)