Java线程池面试要点

简介: Java线程池在面试的时候问的挺多的,曾经我就在面试过程中两次被问到,面试官通过面试者对线程池的理解回答也能大致了解到面试者的实际开发经验如何,以及对多线程的理解运用有没有深入到位。

Java线程池在面试的时候问的挺多的,曾经我就在面试过程中两次被问到,面试官通过面试者对线程池的理解回答也能大致了解到面试者的实际开发经验如何,以及对多线程的理解运用有没有深入到位。



同时,面试官在切入多线程问题的时候通常也不会太过生硬,而是一步一步通过线程创建方式、线程状态切换、线程协同引导过来,整体谈下来其实也挺花时间的,会触及到多线程的方方面面,但对开发者素质确实也是一番不小的考验,今天我们也不完全铺开去描述,就仅仅针对线程池这一点来聊聊面试的时候会碰到的一些问题。


ThreadPoolExecutor参数含义


ThreadPoolExecutor 构造函数参数定义我们可以直接在 concurrent 包当中找到。


public ThreadPoolExecutor(int corePoolSize,
                          int maximumPoolSize,
                          long keepAliveTime,
                          TimeUnit unit,
                          BlockingQueue<Runnable> workQueue,
                          ThreadFactory threadFactory,
                          RejectedExecutionHandler handler) {
    }

这几个核心参数的含义分别是:

  1. corePoolSize:线程池核心线程数量,核心线程不会被回收,即使没有任务执行,也会保持空闲状态,设置 allowCoreThreadTimeOut 参数为 true 才会进行回收。如果线程池中的线程少于此数目,则在执行任务时创建。
  2. maximumPoolSize:线程池最大线程数,表示在线程池中最多能创建多少个线程。当线程数量达到corePoolSize,且workQueue队列塞满任务了之后,继续创建线程,当线程池中的线程数量到达这个数字时,新来的任务会执行拒绝策略。
  3. keepAliveTime:表示线程没有任务执行时最多能保持多少时间会被回收,注意,这个参数控制的是超过corePoolSize之后的“临时线程”的存活时间。
  4. unit:参数 keepAliveTime 的时间单位。
  5. workQueue:工作队列,存放提交的等待任务,其中有队列大小的限制。
  6. threadFactory:创建线程的工厂类,通常我们会自定义一个threadFactory设置线程的名称,这样我们就可以知道线程是由哪个工厂类创建的,可以快速定位排查问题。
  7. handler:如果线程池已满,新的任务进来时的拒绝策略。


ThreadPoolExecutor 参数含义是最常见的一个问题,如果面试者对这些参数比较了解,至少说明面试者在多线程运用层面不会存在太大的问题,反之,如果面试官提示某个参数后面试者还是一脸懵的话,那么基础印象分就会大打折扣。


线程池线程创建的流程是怎样的


线程池线程创建的时机可以用下面这张图简单表示。


image.png


线程创建流程是这样的:


  1. 如果当前运行的线程少于corePoolSize(核心线程数),则创建新线程来执行任务(执行这一步骤需要获取全局锁)。
  2. 如果运行的线程等于或多于corePoolSize,则将任务加入BlockingQueue(阻塞队列/任务队列)。
  3. 如果无法将任务加入BlockingQueue(队列已满),则在非corePool中创建新的线程来处理任务(执行这一步骤也需要获取全局锁)。
  4. 如果创建新线程将使得当前运行的线程超出maximumPoolSize限制,任务将被拒绝,并执行线程饱和策略,如:RejectedExecutionHandler.rejectedExecution()方法。


注意:初始化线程池时,线程数为0。


工作列队有哪几种实现

存放任务的工作队列有6种主要的实现,分别是 ArrayBlockingQueue、LinkedBlockingQueue、LinkedBlockingDeque、PriorityBlockingQueue、DelayQueue、SynchronousQueue。它们的区别如下:

  1. ArrayBlockingQueue:一个由数组结构组成的有界阻塞队列(数组结构可配合指针实现一个环形队列)。
  2. LinkedBlockingQueue:一个由链表结构组成的有界阻塞队列,在未指明容量时,容量默认为 Integer.MAX_VALUE
  3. LinkedBlockingDeque:使用双向队列实现的双端阻塞队列,双端意味着可以像普通队列一样 FIFO(先进先出),可以以像栈一样 FILO(先进后出)
  4. PriorityBlockingQueue:一个支持优先级排序的无界阻塞队列,对元素没有要求,可以实现 Comparable 接口也可以提供 Comparator 来对队列中的元素进行比较,跟时间没有任何关系,仅仅是按照优先级取任务。
  5. DelayQueue:同 PriorityBlockingQueue,也是二叉堆实现的优先级阻塞队列。要求元素都实现 Delayed 接口,通过执行时延从队列中提取任务,时间没到任务取不出来。
  6. SynchronousQueue:一个不存储元素的阻塞队列,消费者线程调用 take() 方法的时候就会发生阻塞,直到有一个生产者线程生产了一个元素,消费者线程就可以拿到这个元素并返回;生产者线程调用put()方法的时候就会发生阻塞,直到有一个消费者线程消费了一个元素,生产者才会返回。


拒绝策略有哪几种


线程池中的线程已经用完了,无法继续为新任务服务,同时,等待队列也已经排满了,再也塞不下新任务了。这时候我们就需要拒绝策略机制合理地处理新进来的任务。JDK 内置的四种拒绝策略如下:


  1. AbortPolicy(默认):丢弃任务并抛出 RejectedExecutionException 异常。
  2. CallerRunsPolicy:由调用线程处理该任务。(例如io操作,线程消费速度没有NIO快,可能导致阻塞队列一直增加,此时可以使用这个模式)。
  3. DiscardPolicy:丢弃任务,但是不抛出异常。(可以配合这种模式进行自定义的处理方式)。
  4. DiscardOldestPolicy:丢弃队列最早的未处理任务,然后重新尝试执行任务。


线程池的分类


Java 里面线程池的顶级接口是 Executor,但是严格意义上讲 Executor 并不是一个线程池,而只是一个执行线程的工具,真正的线程池接口是  ExecutorService。Java中 Executors 工厂类可以为我们自动创建不同策略配置的线程池,供我们直接使用。


 newCachedThreadPool

coreSize 线程数0,最大线程数无限制,线程的允许空闲时间是60s,阻塞队列是 SynchronousQueue。适用于“短任务”情况。由于采用SynchronousQueue,每当提交一个任务,都会超过阻塞队列的长度,导致创建新线程处理,所以说:每当提交一个任务,都会创建一个线程,可能造成OOM。此外,线程空闲1分钟就会销毁,所以该线程池可能会频繁地创建和销毁线程。
 newFixedThreadPool


coreSize 和最大线程数都是用户输入的,阻塞队列用的 LinkedBlockingQueue,线程的允许空闲时间是0s。其核心特性就是线程数不会增加,不会减少,线程池也不会自己销毁。由于阻塞队列是无限大的,不会执行拒绝策略。所以可能会堆积无限的请求,导致OOM。


 newSingleThreadExecutor


相当于线程数为1的 newFixedThreadPool,缺点和 newFixedThreadPool 一样。有的小伙伴可能会问,那它和单个线程有什么区别?


newSingleThreadExecutor Thread

任务执行完成后,不会自动销毁,可以复用

任务执行完成后,会自动销毁

可以将任务存储在阻塞队列中,逐个执行

无法存储任务,只能执行一个任务


 newScheduledThreadPool


支持定时及周期性任务执行,需要注意的是,如果任务执行过程中抛出了异常就会停止执行任务,而且也不会再周期地执行该任务了。所以如果想保持任务周期执行,需要 catch 一切可能的异常。


 newWorkStealingPool


采用的 ForkJoin 框架,可以将任务进行分割,同时线程之间会互相帮助。另外,阻塞队列采用的 LinkedBlockingDeque,可以进行任务窃取。由于实际使用不多,这里只作了解。


实际使用时并不推荐这样去直接创建使用,阿里Java开发规约里面也有相应约束:


【强制】线程池不允许使用 Executors 去创建,而是通过 ThreadPoolExecutor 的方式,这样的处理方式让写的同学更加明确线程池的运行规则,规避资源耗尽的风险。说明:Executors 返回的线程池对象的弊端如下: 1)FixedThreadPool 和 SingleThreadPool: 允许的请求队列长度为 Integer.MAX_VALUE,可能会堆积大量的请求,从而导致 OOM。 2)CachedThreadPool 和 ScheduledThreadPool: 允许的创建线程数量为 Integer.MAX_VALUE,可能会创建大量的线程,从而导致 OOM。


如何关闭线程池


 shutdown(高安全低响应)


本质上执行的是 interrupt 方法,阻止新来的任务提交,会将线程池的状态改成 SHUTDOWN,当再执行 execute 提交任务时,如果测试到状态不为 RUNNING,则执行拒绝策略,从而达到阻止新任务提交的目的。对于已经提交的任务不会产生任何影响,当已经提交的任务执行完以后,它会将那些闲置的线程进行中断,这个过程是异步的,也就是说只会打断空闲线程,如果当前还有任务队列还有任务未执行,线程将继续把任务执行完。


 shutdownNow(低安全高响应)


将阻止新来的任务提交,同时将线程池的状态改成 STOP,当再执行 execute 提交任务时,如果测试到状态不为 RUNNING,则抛出 rejectedExecution,从而达到阻止新任务提交的目的。该方法会中断空闲进程,同时也会中断当前正在运行的线程,即 workers 中的线程。如果遇到已经激活的任务,并且处于阻塞状态时,shutdownNow() 会执行1次中断阻塞的操作,此时对应的线程报 InterruptedException,如果后续还要等待某个资源,则按正常逻辑等待某个资源的到达。例如,一个线程正在 sleep 状态中,此时执行 shutdownNow(),它向该线程发起 interrupt() 请求,而 sleep() 方法遇到有 interrupt() 请求时,会抛出 InterruptedException(),并继续往下执行。在这里要提醒注意的是,在激活的任务中,如果有多个 sleep(),该方法只会中断第一个sleep(),而后面的仍然按照正常的执行逻辑进行。


两张关闭线程池的方式的主要区别用一句话概括就是:高安全低响应体现在 shutdown 等待任务执行完成再关闭,可以保证任务一定被执行,但是关闭线程池需要等待较长的时间;低安全高响应体现在 shutdownNow 会关闭正在执行任务的线程,任务可能并没有执行完毕,也不会回退到任务队列中,将会消失,但是关闭线程池不需要等待较长的时间。


线程池核心线程数经验配置

CPU密集型任务:尽量压榨CPU,参考值设置为CPU的个数+1。IO密集型任务:参考值可以设置为CPU的个数 ✖️ 2。

以上只是经验配置参考,具体的使用配置如果在条件允许的情况下最好使用公司的压测工具或环境压测一下。


使用线程池有什么好处

  1. 线程重用:线程的创建和销毁开销是巨大的,而通过线程池的重用大大减少了这些不必要的开销,当然既然少了这么多开销,其线程执行速度也是突飞猛进的提升。
  2. 控制线程池的并发数:线程不是并发的越多,性能越高,反而在线程并发太多时,线程的切换会消耗系统大量的资源,可以通过设置线程池最大并发线程数目,维持系统高性能。
  3. 线程池可以对线程进行管理:虽然线程提供了线程组操控线程,但是线程池拥有更多管理线程的API。
  4. 可以储存需要执行的任务:当任务提交过多时,可以将任务储存起来,等待线程处理。


最后

以上就是关于线程池的一些核心要点了,单从使用的角度来说,有些细节不用了解的太深入,看完也就忘了。但从面试的角度来说还是需要尽量了解全面一些,至少得对得起简历上那句“对技术有追求”不是?关于线程池今天就介绍这么多,有其他遗漏需要补充的欢迎留言讨论。

团队介绍

我们是阿里巴巴淘系技术部的新品平台技术团队, 依托于淘系大数据正在建立一套完整的涵盖消费者洞察、宏观及细分市场分析、竞争分析、市场策略研究、产品创新机制等的新品研发和创新孵化平台, 为品牌、商家及行业提供规模化的新品孵化和运营能力, 沉淀新品孵化机制和运营策略, 最终建立起一套基于大数据驱动的从市场研究、新品研发到新品投放营销的全链路新品运营平台。发送邮件到tianhang.th#alibaba-inc.com(发送邮件时,请把#替换成@)

相关文章
|
5天前
|
缓存 Java 关系型数据库
【Java面试题汇总】ElasticSearch篇(2023版)
倒排索引、MySQL和ES一致性、ES近实时、ES集群的节点、分片、搭建、脑裂、调优。
【Java面试题汇总】ElasticSearch篇(2023版)
|
5天前
|
设计模式 Java 关系型数据库
【Java笔记+踩坑汇总】Java基础+JavaWeb+SSM+SpringBoot+SpringCloud+瑞吉外卖/谷粒商城/学成在线+设计模式+面试题汇总+性能调优/架构设计+源码解析
本文是“Java学习路线”专栏的导航文章,目标是为Java初学者和初中高级工程师提供一套完整的Java学习路线。
|
5天前
|
设计模式 安全 算法
【Java面试题汇总】设计模式篇(2023版)
谈谈你对设计模式的理解、七大原则、单例模式、工厂模式、代理模式、模板模式、观察者模式、JDK中用到的设计模式、Spring中用到的设计模式
【Java面试题汇总】设计模式篇(2023版)
|
5天前
|
存储 关系型数据库 MySQL
【Java面试题汇总】MySQL数据库篇(2023版)
聚簇索引和非聚簇索引、索引的底层数据结构、B树和B+树、MySQL为什么不用红黑树而用B+树、数据库引擎有哪些、InnoDB的MVCC、乐观锁和悲观锁、ACID、事务隔离级别、MySQL主从同步、MySQL调优
【Java面试题汇总】MySQL数据库篇(2023版)
|
5天前
|
存储 缓存 NoSQL
【Java面试题汇总】Redis篇(2023版)
Redis的数据类型、zset底层实现、持久化策略、分布式锁、缓存穿透、击穿、雪崩的区别、双写一致性、主从同步机制、单线程架构、高可用、缓存淘汰策略、Redis事务是否满足ACID、如何排查Redis中的慢查询
【Java面试题汇总】Redis篇(2023版)
|
5天前
|
缓存 前端开发 Java
【Java面试题汇总】Spring,SpringBoot,SpringMVC,Mybatis,JavaWeb篇(2023版)
Soring Boot的起步依赖、启动流程、自动装配、常用的注解、Spring MVC的执行流程、对MVC的理解、RestFull风格、为什么service层要写接口、MyBatis的缓存机制、$和#有什么区别、resultType和resultMap区别、cookie和session的区别是什么?session的工作原理
【Java面试题汇总】Spring,SpringBoot,SpringMVC,Mybatis,JavaWeb篇(2023版)
|
5天前
|
缓存 Java 数据库
【Java面试题汇总】Spring篇(2023版)
IoC、DI、aop、事务、为什么不建议@Transactional、事务传播级别、@Autowired和@Resource注解的区别、BeanFactory和FactoryBean的区别、Bean的作用域,以及默认的作用域、Bean的生命周期、循环依赖、三级缓存、
【Java面试题汇总】Spring篇(2023版)
|
5天前
|
存储 缓存 监控
【Java面试题汇总】JVM篇(2023版)
JVM内存模型、双亲委派模型、类加载机制、内存溢出、垃圾回收机制、内存泄漏、垃圾回收流程、垃圾回收器、G1、CMS、JVM调优
【Java面试题汇总】JVM篇(2023版)
|
5天前
|
存储 缓存 安全
【Java面试题汇总】多线程、JUC、锁篇(2023版)
线程和进程的区别、CAS的ABA问题、AQS、哪些地方使用了CAS、怎么保证线程安全、线程同步方式、synchronized的用法及原理、Lock、volatile、线程的六个状态、ThreadLocal、线程通信方式、创建方式、两种创建线程池的方法、线程池设置合适的线程数、线程安全的集合?ConcurrentHashMap、JUC
【Java面试题汇总】多线程、JUC、锁篇(2023版)
|
5天前
|
安全 Java API
【Java面试题汇总】Java基础篇——String+集合+泛型+IO+异常+反射(2023版)
String常量池、String、StringBuffer、Stringbuilder有什么区别、List与Set的区别、ArrayList和LinkedList的区别、HashMap底层原理、ConcurrentHashMap、HashMap和Hashtable的区别、泛型擦除、ABA问题、IO多路复用、BIO、NIO、O、异常处理机制、反射
【Java面试题汇总】Java基础篇——String+集合+泛型+IO+异常+反射(2023版)