本文首写于个人云笔记:https://github.com/zengfanjun/JDK-Study/tree/master/src/java1/util/concurrent/ForkJoin
个人相关学习代码:https://github.com/zengfanjun/JDK-Study/tree/master/src/java1/util/concurrent/ForkJoin
1. 什么是Fork/Join框架
Fork/Join框架是Java7提供了的一个用于并行执行任务的框架, 是一个把大任务分割成若干个小任务,最终汇总每个小任务结果后得到大任务结果的框架。
我们再通过Fork和Join这两个单词来理解下Fork/Join框架,Fork就是把一个大任务切分为若干子任务并行的执行,Join就是合并这些子任务的执行结果,最后得到这个大任务的结果。比如计算1+2+。。+10000,可以分割成10个子任务,每个子任务分别对1000个数进行求和,最终汇总这10个子任务的结果。Fork/Join的运行流程图如下:
2. 工作窃取算法
工作窃取(work-stealing)算法是指某个线程从其他队列里窃取任务来执行。工作窃取的运行流程图如下:
那么为什么需要使用工作窃取算法呢?假如我们需要做一个比较大的任务,我们可以把这个任务分割为若干互不依赖的子任务,为了减少线程间的竞争,于是把这些子任务分别放到不同的队列里,并为每个队列创建一个单独的线程来执行队列里的任务,线程和队列一一对应,比如A线程负责处理A队列里的任务。但是有的线程会先把自己队列里的任务干完,而其他线程对应的队列里还有任务等待处理。干完活的线程与其等着,不如去帮其他线程干活,于是它就去其他线程的队列里窃取一个任务来执行。而在这时它们会访问同一个队列,所以为了减少窃取任务线程和被窃取任务线程之间的竞争,通常会使用双端队列,被窃取任务线程永远从双端队列的头部拿任务执行,而窃取任务的线程永远从双端队列的尾部拿任务执行。
工作窃取算法的优点是充分利用线程进行并行计算,并减少了线程间的竞争,其缺点是在某些情况下还是存在竞争,比如双端队列里只有一个任务时。并且消耗了更多的系统资源,比如创建多个线程和多个双端队列。
3. Fork/Join框架的介绍
我们已经很清楚Fork/Join框架的需求了,那么我们可以思考一下,如果让我们来设计一个Fork/Join框架,该如何设计?这个思考有助于你理解Fork/Join框架的设计。
第一步分割任务。首先我们需要有一个fork类来把大任务分割成子任务,有可能子任务还是很大,所以还需要不停的分割,直到分割出的子任务足够小。
第二步执行任务并合并结果。分割的子任务分别放在双端队列里,然后几个启动线程分别从双端队列里获取任务执行。子任务执行完的结果都统一放在一个队列里,启动一个线程从队列里拿数据,然后合并这些数据。
Fork/Join使用两个类来完成以上两件事情:
- ForkJoinTask:我们要使用ForkJoin框架,必须首先创建一个ForkJoin任务。它提供在任务中执行fork()和join()操作的机制,通常情况下我们不需要直接继承ForkJoinTask类,而只需要继承它的子类,Fork/Join框架提供了以下两个子类:
- RecursiveAction:用于没有返回结果的任务。
- RecursiveTask :用于有返回结果的任务。
- ForkJoinPool :ForkJoinTask需要通过ForkJoinPool来执行,任务分割出的子任务会添加到当前工作线程所维护的双端队列中,进入队列的头部。当一个工作线程的队列里暂时没有任务时,它会随机从其他工作线程的队列的尾部获取一个任务。
以上援引:http://ifeve.com/talk-concurrency-forkjoin/
4. 使用Fork/Join框架
/**
* 模板方法.
*
* 由于Java不支持多继承,MyRecursiveTask无法继承模板方法,只能将休眠方法再次写一份。
*
* 在这里写模板方法,只是为了提醒自己将公用模板抽象化。
*
* @author yunhai
*/
public abstract class AbstractTemplate {
/**
* 让线程休眠一下3ms,更加符合实际情况.
*
*/
public void JustSleep() {
try {
Thread.sleep(Constant.INTERVAL_OF_SLEEP_MILLISECONDS);
} catch (InterruptedException e) {
e.printStackTrace();
}
}
}
/**
* 常量.
*
* @author yunhai
*/
public class Constant {
/**
* 线程分组阈值.
*/
public static final int GROUP_THRESHOLD = 2;
/**
* 多线程CPU倍数.
*/
public static final int MULTIPLE_FORKJOIN_PROCESSORS = 3;
/**
* 睡眠时间(ms).
*/
public static final int INTERVAL_OF_SLEEP_MILLISECONDS = 9;
}
import java.util.concurrent.RecursiveTask;
/**
* RecursiveTask任务队列。
*
* @author yunhai
*/
public class MyRecursiveTask extends RecursiveTask { // RecursiveTask表示有结果的任务
private int start;
private int end;
public MyRecursiveTask(int start, int end) { // 任务可增加更多参数适应复杂情况
super();
this.start = start;
this.end = end;
}
@Override
protected Object compute() {
int result = 0;
int resultLeft;
int resultRight;
if (end - start <= Constant.GROUP_THRESHOLD) {
for (int i = start; i <= end; i++) {
result += i; // 可自定义execute方法执行复杂任务
JustSleep(); // 由于Java不支持多继承,无法继承模板方法,只能将休眠方法再次写一份。
// execute(i);
}
} else {
intmiddle = (start + end) / 2;
MyRecursiveTask left = new MyRecursiveTask(start, middle);
MyRecursiveTask right = new MyRecursiveTask(middle + 1, end);
left.fork();
right.fork();
resultLeft = (int) left.join();
resultRight = (int) right.join();
result = resultLeft + resultRight;
}
return result;
}
private void execute(inti) {
// TODO Auto-generated method stub
}
/**
* 让线程休眠一下3ms,更加符合实际情况.
*
*/
public void JustSleep() {
AbstractTemplate abstractTemplate = new AbstractTemplate() {
};
abstractTemplate.JustSleep(); // 不建议如此调用【Abstract方法】,还是建议使用下面的方式
// try {
// Thread.sleep(Constant.INTERVAL_OF_SLEEP_MILLISECONDS);
// } catch (InterruptedException e) {
// e.printStackTrace();
// }
}
}
import java.util.concurrent.ForkJoinPool;
import org.junit.Test;
/**
* ForkJoin,工作窃取(work-stealing)算法
*
* 本测试用例通过计算求1到n的和来演示ForkJoin,为了符合实际开发情况,每add一次均增加了休眠时间。
*
* PS:如果不休眠,【ForkJoin】Time:9ms 【Common】Time:0ms,ForkJoin分而治之多耗费了几毫秒的时间,但这显示不符合实际开发情况,有兴趣的读者可自行尝试。
*
*
* 【ForkJoin】 result=500500; Time:885ms 【Common】 result=500500; Time:9010ms
*
* 由测试结果可以看出,ForkJoin框架消耗的时间约为单线程的十分之一,前段时间在公司做的一个实际项目用ForkJoin的效率也是单线程的10倍左右。
*
* 相关资料:http://ifeve.com/talk-concurrency-forkjoin/
*
* @author yunhai
*/
public class ForkJoinPool_Study extends AbstractTemplate {
ForkJoinPool pool = new ForkJoinPool(Constant.MULTIPLE_FORKJOIN_PROCESSORS * Runtime.getRuntime().availableProcessors());
int n = 1000;
@Test
public void Compare() {
MyForkJoin();
Common();
}
private void MyForkJoin() {
Long timeStart = System.currentTimeMillis();
intresult = 0;
MyRecursiveTask task = new MyRecursiveTask(0, n);
result = (int) pool.invoke(task);
System.out.println("【ForkJoin】 result=" + result + "; Time:" + (System.currentTimeMillis() - timeStart) + "ms");
}
private void Common() {
Long timeStart = System.currentTimeMillis();
intresult = 0;
for (inti = 0; i <= n; i++) {
result += i;
JustSleep();
}
System.out.println("【Common】 result=" + result + "; Time:" + (System.currentTimeMillis() - timeStart) + "ms");
}
}
以上援引:http://ifeve.com/talk-concurrency-forkjoin/
4. 使用Fork/Join框架
/** * 模板方法. * * 由于Java不支持多继承,MyRecursiveTask无法继承模板方法,只能将休眠方法再次写一份。 * * 在这里写模板方法,只是为了提醒自己将公用模板抽象化。 * * @author yunhai */ public abstract class AbstractTemplate { /** * 让线程休眠一下3ms,更加符合实际情况. * */ public void JustSleep() { try { Thread.sleep(Constant.INTERVAL_OF_SLEEP_MILLISECONDS); } catch (InterruptedException e) { e.printStackTrace(); } } }
/** * 常量. * * @author yunhai */ public class Constant { /** * 线程分组阈值. */ public static final int GROUP_THRESHOLD = 2; /** * 多线程CPU倍数. */ public static final int MULTIPLE_FORKJOIN_PROCESSORS = 3; /** * 睡眠时间(ms). */ public static final int INTERVAL_OF_SLEEP_MILLISECONDS = 9; }
import java.util.concurrent.RecursiveTask; /** * RecursiveTask任务队列。 * * @author yunhai */ public class MyRecursiveTask extends RecursiveTask { // RecursiveTask表示有结果的任务 private int start; private int end; public MyRecursiveTask(int start, int end) { // 任务可增加更多参数适应复杂情况 super(); this.start = start; this.end = end; } @Override protected Object compute() { int result = 0; int resultLeft; int resultRight; if (end - start <= Constant.GROUP_THRESHOLD) { for (int i = start; i <= end; i++) { result += i; // 可自定义execute方法执行复杂任务 JustSleep(); // 由于Java不支持多继承,无法继承模板方法,只能将休眠方法再次写一份。 // execute(i); } } else { intmiddle = (start + end) / 2; MyRecursiveTask left = new MyRecursiveTask(start, middle); MyRecursiveTask right = new MyRecursiveTask(middle + 1, end); left.fork(); right.fork(); resultLeft = (int) left.join(); resultRight = (int) right.join(); result = resultLeft + resultRight; } return result; } private void execute(inti) { // TODO Auto-generated method stub } /** * 让线程休眠一下3ms,更加符合实际情况. * */ public void JustSleep() { AbstractTemplate abstractTemplate = new AbstractTemplate() { }; abstractTemplate.JustSleep(); // 不建议如此调用【Abstract方法】,还是建议使用下面的方式 // try { // Thread.sleep(Constant.INTERVAL_OF_SLEEP_MILLISECONDS); // } catch (InterruptedException e) { // e.printStackTrace(); // } } }
import java.util.concurrent.ForkJoinPool; import org.junit.Test; /** * ForkJoin,工作窃取(work-stealing)算法 * * 本测试用例通过计算求1到n的和来演示ForkJoin,为了符合实际开发情况,每add一次均增加了休眠时间。 * * PS:如果不休眠,【ForkJoin】Time:9ms 【Common】Time:0ms,ForkJoin分而治之多耗费了几毫秒的时间,但这显示不符合实际开发情况,有兴趣的读者可自行尝试。 * * * 【ForkJoin】 result=500500; Time:885ms 【Common】 result=500500; Time:9010ms * * 由测试结果可以看出,ForkJoin框架消耗的时间约为单线程的十分之一,前段时间在公司做的一个实际项目用ForkJoin的效率也是单线程的10倍左右。 * * 相关资料:http://ifeve.com/talk-concurrency-forkjoin/ * * @author yunhai */ public class ForkJoinPool_Study extends AbstractTemplate { ForkJoinPool pool = new ForkJoinPool(Constant.MULTIPLE_FORKJOIN_PROCESSORS * Runtime.getRuntime().availableProcessors()); int n = 1000; @Test public void Compare() { MyForkJoin(); Common(); } private void MyForkJoin() { Long timeStart = System.currentTimeMillis(); intresult = 0; MyRecursiveTask task = new MyRecursiveTask(0, n); result = (int) pool.invoke(task); System.out.println("【ForkJoin】 result=" + result + "; Time:" + (System.currentTimeMillis() - timeStart) + "ms"); } private void Common() { Long timeStart = System.currentTimeMillis(); intresult = 0; for (inti = 0; i <= n; i++) { result += i; JustSleep(); } System.out.println("【Common】 result=" + result + "; Time:" + (System.currentTimeMillis() - timeStart) + "ms"); } }