JAVA并发系列--ForkJoinPool初体验

简介: JAVA并发系列--ForkJoinPool初体验

ForkJoinPool初体验

ForkJoinPool是什么

ForkJoinPool是JAVA中较新的线程池,先来尝试一下学习使用。他主要用来处理能够产生子任务的任务。

这个线程池是在 JDK 7 加入的,它的名字 ForkJoin 也描述了它的执行机制,主要用法和之前的线程池是相同的,也是把任务交给线程池去执行,线程池中也有任务队列来存放任务。但是 ForkJoinPool 线程池和之前的线程池有两点非常大的不同之处。第一点它非常适合执行可以产生子任务的任务。

如图所示,我们有一个 Task,这个 Task 可以产生三个子任务,三个子任务并行执行完毕后将结果汇总给 Result,比如说主任务需要执行非常繁重的计算任务,我们就可以把计算拆分成三个部分,这三个部分是互不影响相互独立的,这样就可以利用 CPU 的多核优势,并行计算,然后将结果进行汇总。这里面主要涉及两个步骤,第一步是拆分也就是 Fork,第二步是汇总也就是 Join,到这里你应该已经了解到 ForkJoinPool 线程池名字的由来了。

// 摘自《Java 并发编程 78 讲》

以典型的斐波那契数列为例,f(n)=f(n-1)+f(n-2)。一个任务,可以产生两个子任务,最终汇总成这个任务的结果。经典的实现方式有那么几种:

  1. 递归,自顶向下的思想,一直递归到f(1)为止。这样会产生一颗高log(n)的树,节点个数范围大约2^n。对栈的消耗是恐怖的指数级。
  2. 迭代,自底向上的思想,可以一直从f(1)开始计算到f(n),循环中每次结果都是上一项加上再上一项的值,不仅不消耗栈,也没有分裂产生任务的需求。
  3. 递归 + 记忆。 每次计算该项前先去map,或者array容器中查询该项是否存在,若存在则直接返回,若不存在则取n-1以及n-2项,若有一项取不到,则将其递归取值,最后累加得到结果,放入容器,并返回。[因为f(n-1)=f(n-2)+f(n-3),f(n-2)依次往下推都会被重复执行很多次]。
  4. 迭代 + 记忆。 自底向上计算,把每次循环的计算结果保存到容器中[这里就不去容器取了,加法的耗时可比去map取短多了]。那放容器有啥用。。用处就是:
  1. 下次有要取 [1…n]范围内的数的结果,可以直接取到,
  2. 下次要取的数m大于n时,可以从n开始自底向上计算,节约一大部分计算时间。

嗯。。有点扯远了,我要实践的是ForkJoinPool。那么从上面的四种经典实现,以及Fork拆分任务的特性,肯定只能只用递归的方法了,那么就基于第三种实现方式做改造。

先贴上第三种实现方式的代码:

/**
 * 递归的方式 + 缓存
 */
public class Fib3 implements Fib{
    public Map<Integer, Integer> fib = new HashMap<>();
    @Override
    public int fib(int n) {
        Integer result = fib.get(n);
        if (result != null) {
            return result;
        } else {
            doFib(n);
        }
        return fib.get(n);
    }
    private void doFib(int n) {
        if (n <= 2) {
            fib.put(n, 1);
            return;
        }
        fib.put(n, fib(n - 1) + fib(n - 2));
    }
}

ForkJoinPool的使用

/**
 * FibForkJoin 递归 + 缓存
 */
public class FibForkJoin2 extends RecursiveTask<Integer> {
    private volatile static Map<Integer, Integer> map = new ConcurrentHashMap<Integer, Integer>(50);
    int n;
    public FibForkJoin2(int n) {
        this.n = n;
    }
    @Override
    protected Integer compute() {
        if (n <= 1) {
            return n;
        }
        if (map.get(n) != null) {
            return map.get(n);
        }
        // 分裂任务
        FibForkJoin2 f1 = new FibForkJoin2(n - 1);
        f1.fork();
        FibForkJoin2 f2 = new FibForkJoin2(n - 2);
        f2.fork();
        // 合并任务
        int result = f1.join() + f2.join();
        map.put(n, result);
        return result;
    }
}

MAIN方法测试

public static void main(String[] args) {
        int n = 45;
        ForkJoinPool forkJoinPool = new ForkJoinPool();
        long endTime;
        long startTime = System.currentTimeMillis();
        ForkJoinTask<Integer> task = forkJoinPool.submit(new FibForkJoin2(n));
        try {
            System.out.println(task.get());
            endTime = System.currentTimeMillis();
            System.out.println("forkJoin耗时 :" + (endTime - startTime) );
        } catch (InterruptedException | ExecutionException e) {
            e.printStackTrace();
        }
        Fib3 fib3 = new Fib3();
        startTime = System.currentTimeMillis();
        System.out.println(fib3.fib(n));
        endTime = System.currentTimeMillis();
        System.out.println("Fib3耗时 :" + (endTime - startTime) );
    }

测试结果一

1134903170
forkJoin耗时 :4
1134903170
Fib3耗时 :0
Process finished with exit code 0
  • 结果很“感人”,用了ForkJoinPool反而变慢了,正常的递归+记忆,耗时1毫秒都不到。其实也很好理解的,斐波那契数列计算的一个函数耗时本来就很低,而且加了记忆化之后,就是一个get完事,这样的消耗远低于线程的创建、切换等开销。
  • 实际业务场景上,用到线程池去处理的任务,他不会只是计算一点点东西,往往是十分耗时的,我们模拟sleep(30),来进行尝试,再上方两个代码中都加上sleep,代码如下
// FORK
    @Override
    protected Integer compute() {
        if (n <= 1) {
            return n;
        }
        if (map.get(n) != null) {
            try {
                Thread.sleep(30);
            } catch (InterruptedException e) {
                e.printStackTrace();
            }
            return map.get(n);
        }
        FibForkJoin2 f1 = new FibForkJoin2(n - 1);
        f1.fork();
        FibForkJoin2 f2 = new FibForkJoin2(n - 2);
        f2.fork();
        int result = f1.join() + f2.join();
        map.put(n, result);
        return result;
    }
// FIB3
@Override
    public int fib(int n) {
        Integer result = fib.get(n);
        if (result != null) {
            try {
                Thread.sleep(30);
            } catch (InterruptedException e) {
                e.printStackTrace();
            }
            return result;
        } else {
            doFib(n);
        }
        return fib.get(n);
    }

实验结果二

1134903170
forkJoin耗时 :1252
1134903170
Fib3耗时 :1372
Process finished with exit code 0
  • 从实验结果二来看,单个仅仅是任务耗时需要10毫秒时,用ForkJoinPool就开始体现优势了。那么再试试高时延的情况,比如改成500毫秒再来尝试

实验结果三

1134903170
forkJoin耗时 :19235
1134903170
Fib3耗时 :21231
  • 比较结果二以及结果三
  • 实验二耗时比例是0.912,实验三耗时比例是0.90。得出结论一:在高耗时的任务中,耗时越高,ForkJoinPool体现的优势越大。

那么想看看进一步增加耗时会如何,将sleep的时间调整到1000毫秒。

实验结果四

1134903170
forkJoin耗时 :38345
1134903170
Fib3耗时 :42438
Process finished with exit code 0
  • 结果比较,
  • 耗时比例是0.90,变化没有10毫秒改到500毫秒那么大。
  • 忽略计算斐波那契数列耗时总体4ms不到的时间,比较实验三和实验四可以发现,Fib3耗时是原来的1.99(2)倍,而ForkJoinPool的方式也是原来的1.99(2)倍。个人之所以做这个比较,是认为ForkJoinPool应该是更小的数值,不是刚好2倍的,可能是例子不够正确吧。所以自己又增加了一组2000毫秒的,发现倍数两者都是1.98,姑且认为就是趋近线性的优化吧。
目录
相关文章
|
4月前
|
安全 Java 编译器
揭秘JAVA深渊:那些让你头大的最晦涩知识点,从泛型迷思到并发陷阱,你敢挑战吗?
【8月更文挑战第22天】Java中的难点常隐藏在其高级特性中,如泛型与类型擦除、并发编程中的内存可见性及指令重排,以及反射与动态代理等。这些特性虽强大却也晦涩,要求开发者深入理解JVM运作机制及计算机底层细节。例如,泛型在编译时检查类型以增强安全性,但在运行时因类型擦除而丢失类型信息,可能导致类型安全问题。并发编程中,内存可见性和指令重排对同步机制提出更高要求,不当处理会导致数据不一致。反射与动态代理虽提供运行时行为定制能力,但也增加了复杂度和性能开销。掌握这些知识需深厚的技术底蕴和实践经验。
94 2
|
4月前
|
安全 Java 调度
解锁Java并发编程高阶技能:深入剖析无锁CAS机制、揭秘魔法类Unsafe、精通原子包Atomic,打造高效并发应用
【8月更文挑战第4天】在Java并发编程中,无锁编程以高性能和低延迟应对高并发挑战。核心在于无锁CAS(Compare-And-Swap)机制,它基于硬件支持,确保原子性更新;Unsafe类提供底层内存操作,实现CAS;原子包java.util.concurrent.atomic封装了CAS操作,简化并发编程。通过`AtomicInteger`示例,展现了线程安全的自增操作,突显了这些技术在构建高效并发程序中的关键作用。
75 1
|
28天前
|
存储 安全 Java
Java多线程编程中的并发容器:深入解析与实战应用####
在本文中,我们将探讨Java多线程编程中的一个核心话题——并发容器。不同于传统单一线程环境下的数据结构,并发容器专为多线程场景设计,确保数据访问的线程安全性和高效性。我们将从基础概念出发,逐步深入到`java.util.concurrent`包下的核心并发容器实现,如`ConcurrentHashMap`、`CopyOnWriteArrayList`以及`BlockingQueue`等,通过实例代码演示其使用方法,并分析它们背后的设计原理与适用场景。无论你是Java并发编程的初学者还是希望深化理解的开发者,本文都将为你提供有价值的见解与实践指导。 --- ####
|
1月前
|
存储 设计模式 分布式计算
Java中的多线程编程:并发与并行的深度解析####
在当今软件开发领域,多线程编程已成为提升应用性能、响应速度及资源利用率的关键手段之一。本文将深入探讨Java平台上的多线程机制,从基础概念到高级应用,全面解析并发与并行编程的核心理念、实现方式及其在实际项目中的应用策略。不同于常规摘要的简洁概述,本文旨在通过详尽的技术剖析,为读者构建一个系统化的多线程知识框架,辅以生动实例,让抽象概念具体化,复杂问题简单化。 ####
|
1月前
|
Java 数据库连接 数据库
如何构建高效稳定的Java数据库连接池,涵盖连接池配置、并发控制和异常处理等方面
本文介绍了如何构建高效稳定的Java数据库连接池,涵盖连接池配置、并发控制和异常处理等方面。通过合理配置初始连接数、最大连接数和空闲连接超时时间,确保系统性能和稳定性。文章还探讨了同步阻塞、异步回调和信号量等并发控制策略,并提供了异常处理的最佳实践。最后,给出了一个简单的连接池示例代码,并推荐使用成熟的连接池框架(如HikariCP、C3P0)以简化开发。
51 2
|
2月前
|
Java
【编程进阶知识】揭秘Java多线程:并发与顺序编程的奥秘
本文介绍了Java多线程编程的基础,通过对比顺序执行和并发执行的方式,展示了如何使用`run`方法和`start`方法来控制线程的执行模式。文章通过具体示例详细解析了两者的异同及应用场景,帮助读者更好地理解和运用多线程技术。
32 1
|
3月前
|
Java API 容器
JAVA并发编程系列(10)Condition条件队列-并发协作者
本文通过一线大厂面试真题,模拟消费者-生产者的场景,通过简洁的代码演示,帮助读者快速理解并复用。文章还详细解释了Condition与Object.wait()、notify()的区别,并探讨了Condition的核心原理及其实现机制。
|
4月前
|
存储 Java
Java 中 ConcurrentHashMap 的并发级别
【8月更文挑战第22天】
60 5
|
4月前
|
存储 算法 Java
Java 中的同步集合和并发集合
【8月更文挑战第22天】
52 5
|
4月前
|
缓存 Java 调度
【Java 并发秘籍】线程池大作战:揭秘 JDK 中的线程池家族!
【8月更文挑战第24天】Java的并发库提供多种线程池以应对不同的多线程编程需求。本文通过实例介绍了四种主要线程池:固定大小线程池、可缓存线程池、单一线程线程池及定时任务线程池。固定大小线程池通过预设线程数管理任务队列;可缓存线程池能根据需要动态调整线程数量;单一线程线程池确保任务顺序执行;定时任务线程池支持周期性或延时任务调度。了解并正确选用这些线程池有助于提高程序效率和资源利用率。
61 2
下一篇
DataWorks