你也被Spring的这个“线程池”坑过吗?

简介: 记一次线程池提交命令耗时一秒多的原因分析。

原文链接

前两天一个晚上,正当我沉浸在敲代码的快乐中时,听到隔壁的同事传来一声不可置信的惊呼:线程池提交命令怎么可能会执行一秒多?
线程池提交方法执行一秒多?那不对啊,线程池提交应该是一个很快的操作,一般情况下不应该执行一秒多那么长的时间。
看了一下那段代码,好像也没什么问题,就是一个简单的提交任务的代码。

executor.execute( () -> {
    // 具体的任务代码
    // 这里有个for循环
});

虽然执行的Job里面有一个for循环,可能比较耗时,但是execute提交任务的时候,并不会去真正去执行Job,所以应该不是这个原因引起的。

分析

看到这个情况,我们首先想到的是线程池提交任务时候的一个处理过程:
image.png

然后逐个分析一下有可能耗时一秒多的操作:
创建线程耗时?
根据上面的图,我们可以知道,如果核心线程数量设置过大,就可能会不断创建新的核心线程去执行任务。同理,如果核心线程池和任务队列都满了,会创建非核心线程去执行任务。
创建线程是比较耗时的,而且Java线程池在这里创建线程的时候还上了锁。

final ReentrantLock mainLock = this.mainLock;
mainLock.lock();

我们写个简单的程序,可以模拟出来线程池耗时的操作,下面这段代码创建2w个线程,在我的电脑里大概会耗时6k多毫秒。

long before = System.currentTimeMillis();
for (int i = 0; i < 20000; i++) {
    // doSomething里面睡眠一秒
    new Thread(() -> doSomething()).start();
}
long after = System.currentTimeMillis();
// 下面这行在我的电脑里输出6139
System.out.println(after - before);

但是看了一下我们的监控,线程数量一直比较健康,应该不是这个原因。再说那个地方新线程也不太可能达到这个量级。
入任务队列耗时?
线程池的任务队列是一个同步队列。所以入队列操作是同步的。
常用的几个同步队列:

  1. LinkedBlockingQueue
    链式阻塞队列,底层数据结构是链表,默认大小是Integer.MAX_VALUE,也可以指定大小。
  2. ArrayBlockingQueue
    数组阻塞队列,底层数据结构是数组,需要指定队列的大小。
  3. SynchronousQueue
    同步队列,内部容量为0,每个put操作必须等待一个take操作,反之亦然。
  4. DelayQueue
    延迟队列,该队列中的元素只有当其指定的延迟时间到了,才能够从队列中获取到该元素 。

所以使用特殊的同步队列还是有可能导致execute方法阻塞一秒多的,比如SynchronousQueue。如果配合一个特殊的“拒绝策略”,是有可能造成这个现象的,我们将在下面给出例子。
拒绝策略?
线程数量达到最大线程数就会采用拒绝处理策略,四种拒绝处理的策略为 :

  1. ThreadPoolExecutor.AbortPolicy:默认拒绝处理策略,丢弃任务并抛出异常。
  2. ThreadPoolExecutor.DiscardPolicy:丢弃新来的任务,但是不抛出异常。
  3. ThreadPoolExecutor.DiscardOldestPolicy:丢弃队列头部(最旧的)的任务,然后重新尝试执行程序(如果再次失败,重复此过程)。
  4. ThreadPoolExecutor.CallerRunsPolicy:由调用线程处理该任务。

可以看到,前面三种拒绝处理策略都是会“丢弃”任务,而最后一种不会。最后一种拒绝策略配合上面的SynchronousQueue,就有可能造成我们遇到的情况。示例代码:

Executor executor = new ThreadPoolExecutor(2,2, 2, 
                     TimeUnit.MILLISECONDS,new SynchronousQueue<>(), 
                     new ThreadPoolExecutor.CallerRunsPolicy());
for (int i = 0; i < 3; i++) {
    long before = System.currentTimeMillis();
    executor.execute( () -> {
        // doSomething里面睡眠一秒
        doSomething();
    });
    long after = System.currentTimeMillis();
    // 下面这段代码,第三行会输出1001
    System.out.println(after - before);
}

SimpleAsyncTaskExecutor

所以我们遇到的问题会是上面的种种原因导致的吗?带着这些猜测,我们去找到了定义executor的代码。

SimpleAsyncTaskExecutor executor = new SimpleAsyncTaskExecutor();
executor.setConcurrencyLimit(20);

设置最大并发数量是20好像没什么问题,等等,这个SimpleAsyncTaskExecutor是个什么鬼?
好像是Spring提供的一个线程池吧……(声音逐渐不自信)
em…看了一下包的定义,org.springframework.core.task,确实是Spring提供的。至于是不是线程池,先看看类图:
image.png
实现的是Executor接口,但是继承树里为什么没有ThreadPoolExecutor?我们猜测可能是Spring自己实现了一个线程池?虽然应该没什么必要。

源码

带着疑问,我们继续看了一下这个类的源码。主要看execute方法,发现每次执行之前,都要先调用一个beforeAccess方法,这个方法里面有这样一段很奇怪的代码:
image.png
while循环去检查,如果当前并发线程数量大于等于设置的最大值,就等待。
找到原因了,这应该就是罪魁祸首。可是为什么Spring要这么设计呢?
我们在SimpleAsyncTaskExecutor类的注释上面找到了作者的留言:

 * <p><b>NOTE: This implementation does not reuse threads!</b> Consider a
 * thread-pooling TaskExecutor implementation instead, in particular for
 * executing a large number of short-lived tasks.

大概意思就是:这个实现并不复用线程,如果你要复用线程请去使用线程池的实现。这个是用来执行很多耗时很短的任务的。
至此,真相大白。

反思

使用接口前先了解一下
造成这个问题的根本原因是,我们以为SimpleAsyncTaskExecutor是一个“线程池”,而其实它不是!!!
我们在使用开源项目的时候,往往直接就用了,不会去仔细看看它的源码,也可能没有考虑清楚它的应用环境。等到程序出问题了才发现,已经晚了。
所以使用接口之前最好先了解一下,至少要看看官方文档或者接口文档/注释。
哪怕是真的出问题了,看源码也不失为一种排查问题的方式,因为代码都是死的,它不会骗人。
代码规约
阿里有这么一个代码规约:不建议我们直接使用Executors类中的线程池,而是通过ThreadPoolExecutor的方式,这样的处理方式让写的同学需要更加明确线程池的运行规则,规避资源耗尽的风险。
以前我还不太理解,心想使用Executors类可以提高可读性,JDK提供了这样的工具类,不用白不用。直到遇到这个问题,才明白这条规约的良苦用心。
如果我们使用规范的方式去使用线程池,而不是用一个所谓的Spring提供的“线程池”,就不会遇到这个问题了。
明确接口职责
再来想一想为什么同事会把它当成一个线程池?因为它的类名、方法名都太像一个线程池了。它实现了Executor接口的execute方法,才导致我们误以为它是一个线程池。
所以回归到Executor这个接口上来,它的职责究竟是什么?我们可以在JDK的execute方法上看到这个注释:

/**
* Executes the given command at some time in the future.  The command
* may execute in a new thread, in a pooled thread, or in the calling
* thread, at the discretion of the {@code Executor} implementation.
*/

大意就是,在将来某个时间执行传入的命令,这个命令可能会在一个新的线程里面执行,可能会在线程池里,也可能在调用这个方法的线程中,具体怎么执行是由实现类去决定的。
所以这才是Executor这个类的职责,它的职责并不是提供一个线程池的接口,而是提供一个“将来执行命令”的接口。
所以,真正能代表线程池意义的,是ThreadPoolExecutor类,而不是Executor接口。
在我们写代码的时候,也要定义清楚接口的职责哟。这样别人用你的接口或者阅读源码的时候,才不会疑惑。

来源:编了个程
作者:Yasin x

相关文章
|
1月前
|
人工智能 JSON 前端开发
【Spring boot实战】Springboot+对话ai模型整体框架+高并发线程机制处理优化+提示词工程效果展示(按照框架自己修改可对接市面上百分之99的模型)
【Spring boot实战】Springboot+对话ai模型整体框架+高并发线程机制处理优化+提示词工程效果展示(按照框架自己修改可对接市面上百分之99的模型)
|
6月前
|
XML 安全 Java
Spring框架中的单例bean是线程安全的吗?阿里一面
在 Spring 框架中,Bean 是指由 Spring IoC(Inversion of Control)容器管理的组件或对象。Bean 是 Spring 中最基本的构建块,它们由 Spring 容器实例化、组装和管理。
50 0
|
1月前
|
JavaScript Java API
spring boot使用异步多线程
一文讲清楚spring boot如何结合异步多线程实现文件的导出这类耗时间的操作优化以及常用的场景,了解异步思想
27 0
spring boot使用异步多线程
|
2月前
|
安全 Java 调度
Spring中的多线程魔法:探索@Async注解的妙用
Spring中的多线程魔法:探索@Async注解的妙用
42 0
|
4月前
|
Java Spring
使用spring boot的@Async实现异步调用和线程池复用
使用spring boot的@Async实现异步调用和线程池复用
|
8月前
|
Web App开发 消息中间件 Prometheus
Spring Boot 服务监控,健康检查,线程信息,JVM堆信息,指标收集,运行情况监控等!(一)
Spring Boot 服务监控,健康检查,线程信息,JVM堆信息,指标收集,运行情况监控等!
|
9月前
|
Java Spring
设置 Spring Boot 的定时任务线程池以优雅退出
设置 Spring Boot 的定时任务线程池以优雅退出
184 0
|
5月前
|
XML Java 数据库
Spring在多线程环境下如何确保事务的一致性?
Spring在多线程环境下如何确保事务的一致性?
178 1
|
5月前
|
Java Spring
Spring在多线程中bean的注入问题
Spring在多线程中bean的注入问题
|
7月前
|
安全 Java 数据库
Spring中的Bean是线程安全的吗?
Spring中的Bean是线程安全的吗?
46 0