ForkJoin框架的自我实现

简介: <p>本文首写于个人云笔记:<a target="_blank" href="https://github.com/zengfanjun/JDK-Study/tree/master/src/java1/util/concurrent/ForkJoin">https://github.com/zengfanjun/JDK-Study/tree/master/src/java1/util/co

本文首写于个人云笔记:https://github.com/zengfanjun/JDK-Study/tree/master/src/java1/util/concurrent/ForkJoin

个人相关学习代码https://github.com/zengfanjun/JDK-Study/tree/master/src/java1/util/concurrent/ForkJoin

1. 什么是Fork/Join框架

Fork/Join框架是Java7提供了的一个用于并行执行任务的框架, 是一个把大任务分割成若干个小任务,最终汇总每个小任务结果后得到大任务结果的框架。

我们再通过Fork和Join这两个单词来理解下Fork/Join框架,Fork就是把一个大任务切分为若干子任务并行的执行,Join就是合并这些子任务的执行结果,最后得到这个大任务的结果。比如计算1+2+。。+10000,可以分割成10个子任务,每个子任务分别对1000个数进行求和,最终汇总这10个子任务的结果。Fork/Join的运行流程图如下:

2. 工作窃取算法

工作窃取(work-stealing)算法是指某个线程从其他队列里窃取任务来执行。工作窃取的运行流程图如下:


那么为什么需要使用工作窃取算法呢?假如我们需要做一个比较大的任务,我们可以把这个任务分割为若干互不依赖的子任务,为了减少线程间的竞争,于是把这些子任务分别放到不同的队列里,并为每个队列创建一个单独的线程来执行队列里的任务,线程和队列一一对应,比如A线程负责处理A队列里的任务。但是有的线程会先把自己队列里的任务干完,而其他线程对应的队列里还有任务等待处理。干完活的线程与其等着,不如去帮其他线程干活,于是它就去其他线程的队列里窃取一个任务来执行。而在这时它们会访问同一个队列,所以为了减少窃取任务线程和被窃取任务线程之间的竞争,通常会使用双端队列,被窃取任务线程永远从双端队列的头部拿任务执行,而窃取任务的线程永远从双端队列的尾部拿任务执行。

工作窃取算法的优点是充分利用线程进行并行计算,并减少了线程间的竞争,其缺点是在某些情况下还是存在竞争,比如双端队列里只有一个任务时。并且消耗了更多的系统资源,比如创建多个线程和多个双端队列。

3. Fork/Join框架的介绍

我们已经很清楚Fork/Join框架的需求了,那么我们可以思考一下,如果让我们来设计一个Fork/Join框架,该如何设计?这个思考有助于你理解Fork/Join框架的设计。

第一步分割任务。首先我们需要有一个fork类来把大任务分割成子任务,有可能子任务还是很大,所以还需要不停的分割,直到分割出的子任务足够小。

第二步执行任务并合并结果。分割的子任务分别放在双端队列里,然后几个启动线程分别从双端队列里获取任务执行。子任务执行完的结果都统一放在一个队列里,启动一个线程从队列里拿数据,然后合并这些数据。

Fork/Join使用两个类来完成以上两件事情:

  • ForkJoinTask:我们要使用ForkJoin框架,必须首先创建一个ForkJoin任务。它提供在任务中执行fork()和join()操作的机制,通常情况下我们不需要直接继承ForkJoinTask类,而只需要继承它的子类,Fork/Join框架提供了以下两个子类:
    • RecursiveAction:用于没有返回结果的任务。
    • RecursiveTask :用于有返回结果的任务。
  • ForkJoinPool :ForkJoinTask需要通过ForkJoinPool来执行,任务分割出的子任务会添加到当前工作线程所维护的双端队列中,进入队列的头部。当一个工作线程的队列里暂时没有任务时,它会随机从其他工作线程的队列的尾部获取一个任务。

以上援引:http://ifeve.com/talk-concurrency-forkjoin/

4. 使用Fork/Join框架

/**
 * 模板方法.
 *
 * 由于Java不支持多继承,MyRecursiveTask无法继承模板方法,只能将休眠方法再次写一份。
 *
 * 在这里写模板方法,只是为了提醒自己将公用模板抽象化。
 *
 * @author yunhai
 */
public abstract class AbstractTemplate {
    /**
     * 让线程休眠一下3ms,更加符合实际情况.
     *
     */
    public void JustSleep() {
        try {
            Thread.sleep(Constant.INTERVAL_OF_SLEEP_MILLISECONDS);
        } catch (InterruptedException e) {
            e.printStackTrace();
        }
    }
}

/**
 * 常量.
 *
 * @author yunhai
 */
public class Constant {
    /**
     * 线程分组阈值.
     */
    public static final int GROUP_THRESHOLD = 2;
 
    /**
     * 多线程CPU倍数.
     */
    public static final int MULTIPLE_FORKJOIN_PROCESSORS = 3;
 
    /**
     * 睡眠时间(ms).
     */
    public static final int INTERVAL_OF_SLEEP_MILLISECONDS = 9;
}

import java.util.concurrent.RecursiveTask;
 
/**
 * RecursiveTask任务队列。
 *
 * @author yunhai
 */
public class MyRecursiveTask extends RecursiveTask { // RecursiveTask表示有结果的任务
    private int start;
 
    private int end;
 
    public MyRecursiveTask(int start, int end) { // 任务可增加更多参数适应复杂情况
        super();
        this.start = start;
        this.end = end;
    }
 
    @Override
    protected Object compute() {
        int result = 0;
        int resultLeft;
        int resultRight;
        if (end - start <= Constant.GROUP_THRESHOLD) {
            for (int i = start; i <= end; i++) {
                result += i; // 可自定义execute方法执行复杂任务
                JustSleep(); // 由于Java不支持多继承,无法继承模板方法,只能将休眠方法再次写一份。
                // execute(i);
            }
        } else {
            intmiddle = (start + end) / 2;
            MyRecursiveTask left = new MyRecursiveTask(start, middle);
            MyRecursiveTask right = new MyRecursiveTask(middle + 1, end);
            left.fork();
            right.fork();
            resultLeft = (int) left.join();
            resultRight = (int) right.join();
            result = resultLeft + resultRight;
        }
        return result;
    }
 
    private void execute(inti) {
        // TODO Auto-generated method stub
    }
 
    /**
     * 让线程休眠一下3ms,更加符合实际情况.
     *
     */
    public void JustSleep() {
        AbstractTemplate abstractTemplate = new AbstractTemplate() {
        };
        abstractTemplate.JustSleep(); // 不建议如此调用【Abstract方法】,还是建议使用下面的方式
        // try {
        // Thread.sleep(Constant.INTERVAL_OF_SLEEP_MILLISECONDS);
        // } catch (InterruptedException e) {
        // e.printStackTrace();
        // }
    }
}

import java.util.concurrent.ForkJoinPool;
import org.junit.Test;
 
/**
 * ForkJoin,工作窃取(work-stealing)算法
 *
 * 本测试用例通过计算求1到n的和来演示ForkJoin,为了符合实际开发情况,每add一次均增加了休眠时间。
 *
 * PS:如果不休眠,【ForkJoin】Time:9ms 【Common】Time:0ms,ForkJoin分而治之多耗费了几毫秒的时间,但这显示不符合实际开发情况,有兴趣的读者可自行尝试。
 *
 *
 * 【ForkJoin】 result=500500; Time:885ms 【Common】 result=500500; Time:9010ms
 *
 * 由测试结果可以看出,ForkJoin框架消耗的时间约为单线程的十分之一,前段时间在公司做的一个实际项目用ForkJoin的效率也是单线程的10倍左右。
 *
 * 相关资料:http://ifeve.com/talk-concurrency-forkjoin/
 *
 * @author yunhai
 */
public class ForkJoinPool_Study extends AbstractTemplate {
    ForkJoinPool pool = new ForkJoinPool(Constant.MULTIPLE_FORKJOIN_PROCESSORS * Runtime.getRuntime().availableProcessors());
 
    int n = 1000;
 
    @Test
    public void Compare() {
        MyForkJoin();
        Common();
    }
 
    private void MyForkJoin() {
        Long timeStart = System.currentTimeMillis();
        intresult = 0;
        MyRecursiveTask task = new MyRecursiveTask(0, n);
        result = (int) pool.invoke(task);
        System.out.println("【ForkJoin】  result=" + result + ";  Time:" + (System.currentTimeMillis() - timeStart) + "ms");
    }
 
    private void Common() {
        Long timeStart = System.currentTimeMillis();
        intresult = 0;
        for (inti = 0; i <= n; i++) {
            result += i;
            JustSleep();
        }
        System.out.println("【Common】  result=" + result + ";  Time:" + (System.currentTimeMillis() - timeStart) + "ms");
    }
}





目录
相关文章
|
Java 调度
阿里编程规范不建议使用线程池,为什么?
阿里编程规范不建议使用线程池,为什么?
342 0
|
3月前
|
Java
【Java集合类面试三十】、BlockingQueue中有哪些方法,为什么这样设计?
BlockingQueue设计了四组不同行为方式的方法用于插入、移除和检查元素,以适应不同的业务场景,包括抛异常、返回特定值、阻塞等待和超时等待,以实现高效的线程间通信。
|
4月前
|
存储 Java 索引
(十二)彻悟并发之JUC分治思想产物-ForkJoin分支合并框架原理剖析下篇
在《(十二)彻悟并发之JUC分治思想产物-ForkJoin分支合并框架原理剖析上篇》中,我们曾初步了解了ForkJoin分支合并框架的使用,也分析框架的成员构成以及任务提交和创建工作的原理实现,在本篇则会对框架的任务执行、任务扫描、线程挂起、结果合并以及任务窃取的源码实现进行分析。
|
4月前
|
存储 监控 Java
(十一)彻悟并发之JUC分治思想产物-ForkJoin分支合并框架原理剖析上篇
在上篇文章《深入理解并发之Java线程池、工作原理、复用原理及源码分析》中,曾详细谈到了Java的线程池框架。在其中也说到了JDK提供的四种原生线程池以及自定义线程池,而本文则再来详细谈谈JDK1.7中新推出的线程池:ForkJoinPool。
编程问题之响应式编程使用了哪些技术
编程问题之响应式编程使用了哪些技术
|
5月前
|
Java
【技术瑜伽师】Java 线程:修炼生命周期的平衡之道,达到多线程编程的最高境界!
【6月更文挑战第19天】Java多线程编程犹如瑜伽修行,从创建线程开始,如`new Thread(Runnable)`,到启动线程的活跃,用`start()`赋予生命。面对竞争与冲突,借助同步机制保证资源访问的有序,如`synchronized`关键字。线程可能阻塞等待,如同瑜伽的静止与耐心。完成任务后线程终止,整个过程需密切关注状态变换,以求多线程间的和谐与平衡。持续修炼,如同瑜伽般持之以恒,实现高效稳定的多线程程序。
28 3
|
5月前
|
并行计算 算法 Java
深入理解Java中的ForkJoin框架原理
深入理解Java中的ForkJoin框架原理
|
6月前
|
算法 Java 程序员
论文翻译 | 【深入挖掘Java技术】「底层原理专题」深入分析一下并发编程之父Doug Lea的纽约州立大学的ForkJoin框架的本质和原理
本文深入探讨了一个Java框架的设计、实现及其性能。该框架遵循并行编程的理念,通过递归方式将问题分解为多个子任务,并利用工作窃取技术进行并行处理。所有子任务完成后,其结果被整合以形成完整的并行程序。 在总体设计上,该框架借鉴了Cilk工作窃取框架的核心理念。其核心技术主要聚焦于高效的任务队列构建和管理,以及工作线程的管理。经过实际性能测试,我们发现大多数程序的并行加速效果显著,但仍有优化空间,未来可能需要进一步研究改进方案。
83 3
论文翻译 | 【深入挖掘Java技术】「底层原理专题」深入分析一下并发编程之父Doug Lea的纽约州立大学的ForkJoin框架的本质和原理
|
6月前
|
消息中间件 Java 应用服务中间件
java常用的框架有哪些
【1月更文挑战第13天】java常用的框架有哪些
129 7
并发编程(十二)ForkJoin框架使用
并发编程(十二)ForkJoin框架使用
87 0