ThreadPoolExecutor线程池参数配置最佳实践区分IO与CPU密集型-开发者社区-阿里云

ThreadPoolExecutor线程池参数及其设置规则

2024-04-25 929

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： ThreadPoolExecutor线程池参数及其设置规则

1)为什么需要线程池？

重复利用线程资源，减少创建线程和销毁线程系统所花费的开销，也可以限制请求过多带来的系统压力。在一些场景也可以增加处理的速度。

2)线程池内部怎么保证线程安全?

也就是说一个任务怎么保证不被两个线程都执行？

线程池内部有两部分组成一部分是task任务列表一部分是线程数组，在处理任务是都要去上锁，这个锁其实就是一个变量。等这个任务拿到后再释放锁。

3)创建线程的方式

阿里公司明确指出不建议使用Executors静态方法创建线程，

比如FixedThreadPool 和 SingleThreadPool 队列长度是integer的最大值，如果控制不好的话容易出现内存溢出。

比如CachedThreadPool 和 ScheduledThreadPool 是创建的线程数量是integer的最大值也有可能导致内存溢出。

通常都会用 ThreadPoolExecutor 创建线程池。好处是线程可以控制。

CachedThreadPool底层

·因为没有核心线程，所以任务直接加到SynchronousQueue队列。

public static ExecutorService newCachedThreadPool(ThreadFactory threadFactory) {
    return new ThreadPoolExecutor(0, Integer.MAX_VALUE,
    60L, TimeUnit.SECONDS,
    new SynchronousQueue<Runnable>(),
    threadFactory);
}

newSingleThreadExecutor底层

public static ExecutorService newSingleThreadExecutor(ThreadFactory threadFactory) {
    return new FinalizableDelegatedExecutorService
    (new ThreadPoolExecutor(1, 1,
      0L, TimeUnit.MILLISECONDS,
      new LinkedBlockingQueue<Runnable>(),
    threadFactory));
}

4) ThreadPoolExecutor参数使用

corePoolSize 核心线程数会一直存在，除非allowCoreThreadTimeOut设置为true<br />    maximumPoolSize 线程池最大线程数<br />    keepAliveTime：除了核心线程数外的线程 如果没有任务多久释放。<br />    unit：超时时间的单位<br />    workQueue：工作队列，保存未执行的Runnable 任务<br />    threadFactory：创建线程的工厂类<br />    handler：当线程已满，工作队列也满了的时候，会被调用。被用来实现各种拒绝策略。

5) 线程池的工作机制

如果没有空闲的线程执行该任务，并且线程数没有达到核心线程数，会创建一个新的线程。（如果创建的线程存在空闲的就直接用了）。

如果没有空闲的线程执行该任务，当前线程数已经达到核心线程数，会把任务放到任务队里中。

如果没有空闲的线程执行该任务，当前线程数已经达到核心线程数，如果队列满了会创建一个新的线程。

如果没有空闲的线程执行该任务，当前线程数已经到达最大线程数，会通过handler执行拒绝策略。

6)拒绝策略分四种

1.默认直接拒绝抛出ThreadPoolExecutor.AbortPolicy RejectedExecutionException

2.直接不处理ThreadPoolExecutor.DiscardPolicy()

3.把加入队列最早的任务删除。ThreadPoolExecutor.DiscardOldestPolicy()

4.让调用线程池的任务去处理。ThreadPoolExecutor.CallerRunsPolicy()

自定义拒绝策略实现RejectedExecutionHandler接口，实现抽象方法rejectedExecution方法。

当引用自定义拒绝策略时会初始化自定义拒绝策略类的构造方法。

当线程堵塞触发拒绝策略时会执行rejectedExecution方法。

这几种拒绝策略都是静态内部类实现RejectedExecutionHandler接口。

也可以通过第三方dubbo拒绝策略AbortPolicyWithReport

来处理可以继承AbortPolicy类，重写rejectedExecution

打印出dubbo日志抛出异常

7)队列有哪些？

有五种比较常用的是ArrayBlockingQueue和LinkedBlockingQueue和SynchronousQueue。

ArrayBlockingQueue 是有边界的堵塞队列。

LinkedBlockingQueue 是无边界的堵塞队列，也可以设置边界值。比ArrayBlockingQueue吞吐量要高，原因是ArrayBlockingQueue添加任务和移除任务用的是同一把锁，而LinkedBlockingQueue分别会有一把锁。

SynchronousQueue是是无界的，队列的size始终为0，每个添加任务操作需要等待任务移除操作，反之也是一样。有时我们希望绕开队列，直接分配接收者线程，此时可采用SynchronousQueue，只要当前池的大小还小于最大值，ThreadPoolExecutor就会创建新线程。

SynchronousQueue并不是真正的队列，而是一种管理直接在线程之间移交信息的机制，所有CachedThreadPool用的就是此队列，最大线程数无限大。

8) 如何为线程池设置合适的线程参数？

目前根据一些开源框架，设置多少个线程数量通常是根据应用的类型：I/O 密集型、CPU 密集型

I/O密集型

I/O密集型的场景在开发中比较常见，比如像 MySQL数据库读写、文件的读写、网络通信等任务，这类任务不会特别消耗CPU资源，但是IO操作比较耗时，会占用比较多时间;

IO密集型通常设置为 2n+1，其中 n 为 CPU 核数;

说白了，对于i/o密集型的场景，不太占用cpu资源，所以并发的任务数大于cpu的核数，这样的话能更加充分的利用CPU资源；

CPU密集型

CPU密集型的场景，比如像加解密，压缩、计算等一系列需要大量耗费 CPU 资源的任务，这些场景大部分都是纯 CPU计算;

CPU密集型通常设置为n+1,这样也可避免多线程环境下CPU资源挣钱带来上下文频繁切换的开销；

如何获取当前服务器的cpu核数？

int cors= Runtime.getRuntime().availableProcessors();

无界队列问题

实际运行中，我们一般会设置线程池的阻塞队列长度，如果不设置，则采用默认值：

private int corePoolSize = 1;
private int maxPoolSize = Integer.MAX_VALUE;
private int keepAliveSeconds = 60;
private int queueCapacity = Integer.MAX_VALUE;

在这个过程中，如果设置或者使用不当，容易造成内存溢出问题，同时如果设置了无界队列，那么线程池的最大线程数也就失去了意义；

所以企业开发中会命令禁止使用默认的队列长度；

ThreadPoolExecutor线程池参数及其设置规则

1)为什么需要线程池？

2)线程池内部怎么保证线程安全?

3)创建线程的方式

newSingleThreadExecutor底层

4) ThreadPoolExecutor参数使用

5) 线程池的工作机制

6)拒绝策略分四种

7)队列有哪些？

8) 如何为线程池设置合适的线程参数？

如何获取当前服务器的cpu核数？

无界队列问题

热门文章

最新文章

相关电子书

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

ThreadPoolExecutor线程池参数及其设置规则

1)为什么需要线程池？

2)线程池内部怎么保证线程安全?

3)创建线程的方式

newSingleThreadExecutor底层

4) ThreadPoolExecutor参数使用

5) 线程池的工作机制

6)拒绝策略分四种

7)队列有哪些？

8) 如何为线程池设置合适的线程参数？

如何获取当前服务器的cpu核数？

无界队列问题

热门文章

最新文章

相关电子书