ForkJoin框架的自我实现

简介: <p>本文首写于个人云笔记:<a target="_blank" href="https://github.com/zengfanjun/JDK-Study/tree/master/src/java1/util/concurrent/ForkJoin">https://github.com/zengfanjun/JDK-Study/tree/master/src/java1/util/co

本文首写于个人云笔记:https://github.com/zengfanjun/JDK-Study/tree/master/src/java1/util/concurrent/ForkJoin

个人相关学习代码https://github.com/zengfanjun/JDK-Study/tree/master/src/java1/util/concurrent/ForkJoin

1. 什么是Fork/Join框架

Fork/Join框架是Java7提供了的一个用于并行执行任务的框架, 是一个把大任务分割成若干个小任务,最终汇总每个小任务结果后得到大任务结果的框架。

我们再通过Fork和Join这两个单词来理解下Fork/Join框架,Fork就是把一个大任务切分为若干子任务并行的执行,Join就是合并这些子任务的执行结果,最后得到这个大任务的结果。比如计算1+2+。。+10000,可以分割成10个子任务,每个子任务分别对1000个数进行求和,最终汇总这10个子任务的结果。Fork/Join的运行流程图如下:

2. 工作窃取算法

工作窃取(work-stealing)算法是指某个线程从其他队列里窃取任务来执行。工作窃取的运行流程图如下:


那么为什么需要使用工作窃取算法呢?假如我们需要做一个比较大的任务,我们可以把这个任务分割为若干互不依赖的子任务,为了减少线程间的竞争,于是把这些子任务分别放到不同的队列里,并为每个队列创建一个单独的线程来执行队列里的任务,线程和队列一一对应,比如A线程负责处理A队列里的任务。但是有的线程会先把自己队列里的任务干完,而其他线程对应的队列里还有任务等待处理。干完活的线程与其等着,不如去帮其他线程干活,于是它就去其他线程的队列里窃取一个任务来执行。而在这时它们会访问同一个队列,所以为了减少窃取任务线程和被窃取任务线程之间的竞争,通常会使用双端队列,被窃取任务线程永远从双端队列的头部拿任务执行,而窃取任务的线程永远从双端队列的尾部拿任务执行。

工作窃取算法的优点是充分利用线程进行并行计算,并减少了线程间的竞争,其缺点是在某些情况下还是存在竞争,比如双端队列里只有一个任务时。并且消耗了更多的系统资源,比如创建多个线程和多个双端队列。

3. Fork/Join框架的介绍

我们已经很清楚Fork/Join框架的需求了,那么我们可以思考一下,如果让我们来设计一个Fork/Join框架,该如何设计?这个思考有助于你理解Fork/Join框架的设计。

第一步分割任务。首先我们需要有一个fork类来把大任务分割成子任务,有可能子任务还是很大,所以还需要不停的分割,直到分割出的子任务足够小。

第二步执行任务并合并结果。分割的子任务分别放在双端队列里,然后几个启动线程分别从双端队列里获取任务执行。子任务执行完的结果都统一放在一个队列里,启动一个线程从队列里拿数据,然后合并这些数据。

Fork/Join使用两个类来完成以上两件事情:

  • ForkJoinTask:我们要使用ForkJoin框架,必须首先创建一个ForkJoin任务。它提供在任务中执行fork()和join()操作的机制,通常情况下我们不需要直接继承ForkJoinTask类,而只需要继承它的子类,Fork/Join框架提供了以下两个子类:
    • RecursiveAction:用于没有返回结果的任务。
    • RecursiveTask :用于有返回结果的任务。
  • ForkJoinPool :ForkJoinTask需要通过ForkJoinPool来执行,任务分割出的子任务会添加到当前工作线程所维护的双端队列中,进入队列的头部。当一个工作线程的队列里暂时没有任务时,它会随机从其他工作线程的队列的尾部获取一个任务。

以上援引:http://ifeve.com/talk-concurrency-forkjoin/

4. 使用Fork/Join框架

/**
 * 模板方法.
 *
 * 由于Java不支持多继承,MyRecursiveTask无法继承模板方法,只能将休眠方法再次写一份。
 *
 * 在这里写模板方法,只是为了提醒自己将公用模板抽象化。
 *
 * @author yunhai
 */
public abstract class AbstractTemplate {
    /**
     * 让线程休眠一下3ms,更加符合实际情况.
     *
     */
    public void JustSleep() {
        try {
            Thread.sleep(Constant.INTERVAL_OF_SLEEP_MILLISECONDS);
        } catch (InterruptedException e) {
            e.printStackTrace();
        }
    }
}

/**
 * 常量.
 *
 * @author yunhai
 */
public class Constant {
    /**
     * 线程分组阈值.
     */
    public static final int GROUP_THRESHOLD = 2;
 
    /**
     * 多线程CPU倍数.
     */
    public static final int MULTIPLE_FORKJOIN_PROCESSORS = 3;
 
    /**
     * 睡眠时间(ms).
     */
    public static final int INTERVAL_OF_SLEEP_MILLISECONDS = 9;
}

import java.util.concurrent.RecursiveTask;
 
/**
 * RecursiveTask任务队列。
 *
 * @author yunhai
 */
public class MyRecursiveTask extends RecursiveTask { // RecursiveTask表示有结果的任务
    private int start;
 
    private int end;
 
    public MyRecursiveTask(int start, int end) { // 任务可增加更多参数适应复杂情况
        super();
        this.start = start;
        this.end = end;
    }
 
    @Override
    protected Object compute() {
        int result = 0;
        int resultLeft;
        int resultRight;
        if (end - start <= Constant.GROUP_THRESHOLD) {
            for (int i = start; i <= end; i++) {
                result += i; // 可自定义execute方法执行复杂任务
                JustSleep(); // 由于Java不支持多继承,无法继承模板方法,只能将休眠方法再次写一份。
                // execute(i);
            }
        } else {
            intmiddle = (start + end) / 2;
            MyRecursiveTask left = new MyRecursiveTask(start, middle);
            MyRecursiveTask right = new MyRecursiveTask(middle + 1, end);
            left.fork();
            right.fork();
            resultLeft = (int) left.join();
            resultRight = (int) right.join();
            result = resultLeft + resultRight;
        }
        return result;
    }
 
    private void execute(inti) {
        // TODO Auto-generated method stub
    }
 
    /**
     * 让线程休眠一下3ms,更加符合实际情况.
     *
     */
    public void JustSleep() {
        AbstractTemplate abstractTemplate = new AbstractTemplate() {
        };
        abstractTemplate.JustSleep(); // 不建议如此调用【Abstract方法】,还是建议使用下面的方式
        // try {
        // Thread.sleep(Constant.INTERVAL_OF_SLEEP_MILLISECONDS);
        // } catch (InterruptedException e) {
        // e.printStackTrace();
        // }
    }
}

import java.util.concurrent.ForkJoinPool;
import org.junit.Test;
 
/**
 * ForkJoin,工作窃取(work-stealing)算法
 *
 * 本测试用例通过计算求1到n的和来演示ForkJoin,为了符合实际开发情况,每add一次均增加了休眠时间。
 *
 * PS:如果不休眠,【ForkJoin】Time:9ms 【Common】Time:0ms,ForkJoin分而治之多耗费了几毫秒的时间,但这显示不符合实际开发情况,有兴趣的读者可自行尝试。
 *
 *
 * 【ForkJoin】 result=500500; Time:885ms 【Common】 result=500500; Time:9010ms
 *
 * 由测试结果可以看出,ForkJoin框架消耗的时间约为单线程的十分之一,前段时间在公司做的一个实际项目用ForkJoin的效率也是单线程的10倍左右。
 *
 * 相关资料:http://ifeve.com/talk-concurrency-forkjoin/
 *
 * @author yunhai
 */
public class ForkJoinPool_Study extends AbstractTemplate {
    ForkJoinPool pool = new ForkJoinPool(Constant.MULTIPLE_FORKJOIN_PROCESSORS * Runtime.getRuntime().availableProcessors());
 
    int n = 1000;
 
    @Test
    public void Compare() {
        MyForkJoin();
        Common();
    }
 
    private void MyForkJoin() {
        Long timeStart = System.currentTimeMillis();
        intresult = 0;
        MyRecursiveTask task = new MyRecursiveTask(0, n);
        result = (int) pool.invoke(task);
        System.out.println("【ForkJoin】  result=" + result + ";  Time:" + (System.currentTimeMillis() - timeStart) + "ms");
    }
 
    private void Common() {
        Long timeStart = System.currentTimeMillis();
        intresult = 0;
        for (inti = 0; i <= n; i++) {
            result += i;
            JustSleep();
        }
        System.out.println("【Common】  result=" + result + ";  Time:" + (System.currentTimeMillis() - timeStart) + "ms");
    }
}





目录
相关文章
|
4月前
|
并行计算 算法 Java
Java线程池——Executor框架
Executor 框架是 Java5 之后引进的,在 Java 5 之后,通过 Executor 来启动线程比使用 Thread 的 start 方法更好,除了更易管理,效率更好(用线程池实现,节约开销)。 Executor 框架不仅包括了线程池的管理,还提供了线程工厂、队列以及拒绝策略等,Executor 框架让并发编程变得更加简单。
|
6月前
|
并行计算 Java
【Future&ForkJoin框架原理】
【Future&ForkJoin框架原理】
|
6月前
|
安全 Java
异步编程 - 03 线程池ThreadPoolExecutor原理剖析&源码详解2
异步编程 - 03 线程池ThreadPoolExecutor原理剖析&源码详解2
35 0
|
6月前
|
Java
异步编程 - 03 线程池ThreadPoolExecutor原理剖析&源码详解1
异步编程 - 03 线程池ThreadPoolExecutor原理剖析&源码详解
19 0
|
11月前
|
存储 监控 Java
[并发编程] - Executor框架#ThreadPoolExecutor源码解读02
[并发编程] - Executor框架#ThreadPoolExecutor源码解读02
89 0
|
11月前
|
监控 安全 Java
[并发编程] - Executor框架#ThreadPoolExecutor源码解读01
[并发编程] - Executor框架#ThreadPoolExecutor源码解读01
69 0
|
11月前
|
Java
[并发编程] - Executor框架#ThreadPoolExecutor源码解读03
[并发编程] - Executor框架#ThreadPoolExecutor源码解读03
44 0
|
11月前
|
存储 缓存 Java
【并发编程】线程池及Executor框架
【并发编程】线程池及Executor框架
并发编程(十二)ForkJoin框架使用
并发编程(十二)ForkJoin框架使用
62 0