概念解释
说这个命题之前,我先解释一下编程里,有状态和无状态都什么意思
有状态
有状态就是有数据存储功能,线程不安全
无状态
无状态就是一次操作,不能保存数据。线程安全
下面我们先看看Srping中的Bean来辅助理解:
Spring中的有状态(Stateful)和无状态(Stateless)
1.无状态的Bean适合用不变模式,技术就是单例模式,这样可以共享实例,提高性能。有状态的Bean,多线程环境下不安全,那么适合用Prototype原型模式。Prototype: 每次对bean的请求都会创建一个新的bean实例。
2.默认情况下,从Spring bean工厂所取得的实例为singleton(scope属性为singleton),容器只存在一个共享的bean实例
3.Service层、Dao层用默认singleton就行,虽然Service类也有dao这样的属性,但dao这些类都是没有状态信息的,也就是相当于不变(immutable)类,所以不影响。Struts2中的Action因为会有User、BizEntity这样的实例对象,是有状态信息的,在多线程环境下是不安全的,所以Struts2默认的实现是Prototype模式。在Spring中,Struts2的Action中,scope要配成prototype作用域
Servlet、Out,Request,Response,Session,Config,Page,PageContext是线程安全的,Application在整个系统内被使用,所以不是线程安全的.
Stream流操作的有状态 vs 无状态
比如map或者filter会从输入流中获取每一个元素,并且在输出流中得到一个结果,这些操作没有内部状态,称为无状态操作。
但是像reduce、sum、max这些操作都需要内部状态来累计计算结果,所以称为有状态操作。
这里需要单独解释一下:
有一些操作sort、distinct、limit、skip看上去和filter、map差不多,他们接收一个流,再生成一个流,但是区别在于排序和去重复项需要知道先前的历史。比如排序就需要将所有元素放入缓存区后才能给输出流加入一个项目,这个操作对缓存的要求是无上限的,流有多大就需要多大的缓存才能进行运算。这些操作也是有状态操作。
所以判断流操作是否有状态的判断标准,就是看是否需要知道先前的数据历史。前后数据是否有依赖关系来判断
中间操作就像是水管的一部分,终端操作就像水龙头,增加水管长度不会消耗水,只有打开水龙头才会开始消耗水。
peek方法一般在debug的时候才会开启
下面举个例子,体验一把有状态和无状态:
String str = "my name is fangshixiang"; Stream.of(str.split(" ")).peek(x -> System.out.println(Thread.currentThread().getName() + "___" + x)) .map(x -> x.length()).count(); 输出: main___my main___name main___is main___fangshixiang
我们发现,打印的线程都是main主线程,因为我们是串行流嘛。
现在我们试试并行流打印输出:
public static void main(String[] args) { //打印每个单词的长度 String str = "my name is fangshixiang"; Stream.of(str.split(" ")).parallel().peek(x -> System.out.println(Thread.currentThread().getName() + "___" + x)) .map(x -> x.length()).count(); } 输出: ForkJoinPool.commonPool-worker-1___fangshixiang main___is ForkJoinPool.commonPool-worker-2___name ForkJoinPool.commonPool-worker-3___my
看出效果了没?并行流输出无顺序。并行流采用的ForkJoin框架的线程池ForkJoinPool.commonPool。所有的并行流都会使用同一个线程池,所以如果并行流太多的话,也会出现阻塞的。因此若需要,我们可以让它使用我们自己的线程池,来提高效率。
备注ForkJoinPool.commonPool的线程池大小默认为CPU核心数量。当然可以通脱System.setProperty手动修改这个值,只是一般都没有需要