预计阅读 7分钟建议收藏后阅读,转发分享是前进的动力,原创不易
在 Java 语言中创建线程有两种方式,分别是实现 Runnable
接口或者 new Thread()
就可以了,但是实际上创建线程可不仅是创建对象这么简单。创建对象仅仅是在 JVM
的堆分配一块内存而已;
而创建线程还需要和操作系统内核的 API
,然后操作系统还要为线程分配一系列资源。涉及内核切换,这个成本就很高。所以线程是一个重量级对象,要避免频繁的创建和销毁。
所以问题来了,如何避免呢?那就是利用池化技术思想,线程池登场。
1. 快速创建线程池
线程池的需求是如此普遍,所以 Java SDK
并发包自然也少不了它。Java 并发包里提供了一个线程池的静态工厂类 Executors
,利用Executors
你可以快速创建线程池。不过目前大厂的编码规范中基本上都不建议使用Executors
了 。
不建议使用的重要原因是:提供的很多方法默认使用的是无界的 LinkedBlockingQueue
, 高负载情况下,无界队列很容易导致 OOM
,一旦 OOM
会导致所有请求都无法处理。
主要提供的工厂方法如下所示:
newCachedThreadPool()
创建一个可缓存的线程池,调用execute()
将重用以前构造的线程(如果线程可用)。如果没有可用的线程,则创建一个新线程并添加到池中。终止并从缓存中移除那些已有 60 秒钟未被使用的线程。newFiexedThreadPool(int Threads)
:创建一个固定数量线程的线程池,并使用LinkedBlockingQueue
无界队列保存任务。newSingleThreadExecutor()
:创建一个单线程化的Executor
。public static ScheduledExecutorService newScheduledThreadPool(int corePoolSize)
:创建一个支持定时及周期性的任务执行的线程池,多数情况下可用来替代 Timer 类。
虽然这些方法不推荐使用 ,但是我们还是要了解为何不用,主要还是不能很好的去控制线程池的策略。以及队列类型。所以接下来我们介绍重要的ThreadPoolExecutor
来创建线程池。
2. ThreadPoolExecutor 合理创建线程池
ThreadPoolExecutor
构造函数非常复杂,如下所示,这个最完备的构造函数有 7 个参数。
public ThreadPoolExecutor(int corePoolSize, int maximumPoolSize, long keepAliveTime, TimeUnit unit, BlockingQueue<Runnable> workQueue, ThreadFactory threadFactory, RejectedExecutionHandler handler)
接下来我们一一介绍每个参数的含义。我们可以把线程池比拟为 一个项目组,线程就是项目组的成员
corePoolSize
:表示线程池保有的最小线程数。即使很闲也不能把人给撤了,至少要留corePoolSize
个人坚守。maximumPoolSize
:线程池创建的最大线程数。当项目很忙的时候,需要加人但是并不是无限制的加,最多加到maximumPoolSize
个人,当项目闲下来的时候,就要撤走,最多能撤到corePoolSize
个人。keepAliveTime & unit
:刚提到根据项目闲忙来增减人员,在 Java 这如何定义忙闲?就是通过一个线程如果在一段时间内都没有执行任务,说明很闲了。keepAliveTime & unit
就是用来定义这个一段时间
的参数。如果线程数大于corePoolSize
且空闲了keepAliveTime & unit
这么久,那么这个空闲的线程就要被回收了。workQueue
:工作队列,当前忙碌的线程数量达到了corePoolSize
且任务队列还没满的时候,新的任务会先被放到该队列中。threadFactory
:通过这个参数你可以自定义如何创建线程,例如你可以给线程指定一个有意义的名字。handler
:通过这个参数你可以自定义任务的拒绝策略。如果线程池中所有的线程都在忙碌,并且工作队列也满了(前提是工作队列是有界队列),那么此时提交任务,线程池就会拒绝接收。至于拒绝的策略,你可以通过 handler 这个参数来指定。ThreadPoolExecutor
已经提供了以下 4 种策略。也可自定义拒绝策略,只要实现RejectedExecutionHandler
。
Java 在 1.6 版本还增加了allowCoreThreadTimeOut(boolean value)
方法,它可以让所有线程都支持超时,这意味着如果项目很闲,就会将项目组的成员都撤走。
CallerRunsPolicy
:提交任务的线程自己去执行该任务。AbortPolicy
:默认的拒绝策略,会throws RejectedExecutionException
。DiscardPolicy
:丢弃最老的任务,也就是把最早进入工作队列的任务丢掉,然后把新任务加到工作队列中。
3. 代码实战
public class ThreadPoolExecutorDemo { // 创建一个线程池 private ThreadPoolExecutor threadPoolExecutor = new ThreadPoolExecutor(4, 8 , 60, TimeUnit.SECONDS, new ArrayBlockingQueue<>(200), new NamedThreadFactory("my exec pool-", false), new CustomizeDiscardPolicy()); public void execute(Runnable runnable) { threadPoolExecutor.execute(runnable); } /** * 自定义拒绝策略 */ public static class CustomizeDiscardPolicy implements RejectedExecutionHandler { public CustomizeDiscardPolicy() { } @Override public void rejectedExecution(Runnable r, ThreadPoolExecutor executor) { System.out.println("Task " + r.toString() + " rejected from " + executor.toString()); } } } public class ThreadPoolExecutorTest { @Test public void testRun() { ThreadPoolExecutorDemo threadPoolExecutorDemo = new ThreadPoolExecutorDemo(); for (int i = 0; i < 10; i++) { int finalI = i; threadPoolExecutorDemo.execute(() -> System.out.println(Thread.currentThread().getName() + finalI)); } } }
4.总结
线程池就是一种生产者-消费者模式, 线程池的使用方是生产者,线程池本身是消费者。
至于设置多大的线程数量:
1. 对于 CPU 密集型的计算场景,理论上“线程的数量 =CPU 核数”就是最合适的。不过在工程上,线程的数量一般会设置为“CPU 核数 +1”,这样的话,当线程因为偶尔的内存页失效或其他原因导致阻塞时,这个额外的线程可以顶上,从而保证 CPU 的利用率。
最佳线程数 =CPU 核数 * [ 1 +(I/O 耗时 / CPU 耗时)]
。除此之外,其实 spring 也帮我们封装了线程池的创建,读者们可以查看 Spring Boot 实现异步调用 。