Java8中有两大最为重要的改变。第一个是Lambda 表达式;另外一个则是Stream API(java.util.stream.*)。
Stream 是Java8 中处理集合的关键抽象概念,它可以指定你希望对集合进行的操作,可以执行非常复杂的查找、过滤和映射数据等操作。使用Stream API 对集合数据进行操作,就类似于使用SQL 执行的数据库查询。也可以使用Stream API 来并行执行操作。简而言之,Stream API 提供了一种高效且易于使用的处理数据的方式。
java.util.stream包中类如下所示:
【5】Stream简解
① 什么是Stream
流(Stream) 到底是什么呢?是数据渠道,用于操作数据源(集合、数组等)所生成的元素序列。“集合讲的是数据,流讲的是计算!”
三个特点:
- ①Stream 自己不会存储元素。
- ②Stream 不会改变源对象。相反,他们会返回一个持有结果的新Stream。
- ③Stream 操作是延迟执行的。这意味着他们会等到需要结果的时候才执行。
② Stream 的操作三个步骤
- 创建Stream:一个数据源(如:集合、数组),获取一个流
- 中间操作:一个中间操作链,对数据源的数据进行处理
- 终止操作(终端操作):一个终止操作,执行中间操作链,并产生结果
③ 创建Stream
Stream创建有如下四种方式:
Java8 中的Collection 接口被扩展,提供了两个获取流的方法:
default Stream<E> stream() : 返回一个顺序流
default Stream<E> parallelStream() : 返回一个并行流
Java8 中的Arrays 的静态方法stream() 可以获取数组流:
static <T> Stream<T> stream(T[] array): 返回一个流
可以使用静态方法Stream.of(), 通过显示值创建一个流。它可以接收任意数量的参数。
public static<T> Stream<T> of(T... values) : 返回一个流
由函数创建流–创建无限流。可以使用静态方法Stream.iterate() 和Stream.generate(), 创建无限流。
// 迭代 public static<T> Stream<T> iterate(final T seed, final UnaryOperator<T> f) //生成 public static<T> Stream<T> generate(Supplier<T> s) :
测试代码如下:
@Test public void test1(){ //1. Collection 提供了两个方法 stream() 与 parallelStream() List<String> list = new ArrayList<>(); Stream<String> stream = list.stream(); //获取一个顺序流 Stream<String> parallelStream = list.parallelStream(); //获取一个并行流 //2. 通过 Arrays 中的 stream() 获取一个数组流 Integer[] nums = new Integer[10]; Stream<Integer> stream1 = Arrays.stream(nums); //3. 通过 Stream 类中静态方法 of() Stream<Integer> stream2 = Stream.of(1,2,3,4,5,6); //4. 创建无限流 //迭代 Stream<Integer> stream3 = Stream.iterate(0, (x) -> x + 2).limit(10); stream3.forEach(System.out::println); //生成 Stream<Double> stream4 = Stream.generate(Math::random).limit(2); stream4.forEach(System.out::println); }
④ Stream中间操作
多个中间操作可以连接起来形成一个流水线,除非流水线上触发终止操作,否则中间操作不会执行任何的处理!而在终止操作时一次性全部处理,称为“惰性求值”。
Stream中间操作主要有:筛选与切片、映射和排序。
以下代码测试均基于emps :
List<Employee> emps = Arrays.asList( new Employee(102, "李四", 59, 6666.66), new Employee(101, "张三", 18, 9999.99), new Employee(103, "王五", 28, 3333.33), new Employee(104, "赵六", 8, 7777.77), new Employee(104, "赵六", 8, 7777.77), new Employee(104, "赵六", 8, 7777.77), new Employee(105, "田七", 38, 5555.55) );
筛选与切片
方法 | 描述 |
filter(Predicate p) | 接收Lambda , 从流中排除某些元素。 |
distinct() | 筛选,通过流所生成元素的hashCode() 和equals() 去除重复元素 |
limit(long maxSize) | 截断流,使其元素不超过给定数量 |
skip(long n) | 跳过元素,返回一个扔掉了前n个元素的流。 若流中元素不足n个,则返回一个空流。与limit(n) 互补 |
测试代码如下: |
@Test public void test5(){ emps.parallelStream() .filter((e) -> e.getSalary() >= 1000)//过滤 .limit(2)//截断 .skip(2)//跳过 .forEach(System.out::println);//遍历输出 }
映射
方法 | 描述 |
map(Function f) | 接收一个函数作为参数,该函数会被应用到每个元素上,并将其映射成一个新的元素。 |
mapToDouble(ToDoubleFunction f) | 接收一个函数作为参数,该函数会被应用到每个元素上,产生一个新的DoubleStream。 |
mapToInt(ToIntFunction f) | 接收一个函数作为参数,该函数会被应用到每个元素上,产生一个新的IntStream。 |
mapToLong(ToLongFunction f) | 接收一个函数作为参数,该函数会被应用到每个元素上,产生一个新的LongStream。 |
flatMap(Function f) | 接收一个函数作为参数,将流中的每个值都换成另一个流,然后把所有流连接成一个流 |
map与flatMap区别类似于list.add()和list.addAll()区别。前者将目标对象作为一个整体添加进list,后者则将目标对象的元素添加进list(如果目标对象是一个list)。
测试代码如下:
@Test public void test1(){ List<String> strList = Arrays.asList("aaa", "bbb", "ccc", "ddd", "eee"); //将strList中每个字符转为大写 Stream<String> stream = strList.stream() .map(String::toUpperCase); stream.forEach(System.out::println); //流中流,外部流中元素为一个个内部流 Stream<Stream<Character>> stream2 = strList.stream() .map(TestStreamAPI1::filterCharacter); stream2.forEach((sm) -> { sm.forEach(System.out::println); }); System.out.println("---------------------------------------------"); //使用flatMap将其合并为一个流,流中为一个个字符 Stream<Character> stream3 = strList.stream() .flatMap(TestStreamAPI1::filterCharacter); stream3.forEach(System.out::println); } public static Stream<Character> filterCharacter(String str){ List<Character> list = new ArrayList<>(); for (Character ch : str.toCharArray()) { list.add(ch); } return list.stream(); }
将映射后的流再次收集为list:
String[] filmIdLists = String.valueOf(currMap.get("film_id_list")).split(","); ArrayList<Long> arrayList = Stream.of(filmIdLists).mapToLong(e -> Long.parseLong(e)) .collect(ArrayList::new, ArrayList::add, ArrayList::addAll);
排序
方法 | 描述 |
sorted() | 产生一个新流,其中按自然顺序排序 |
sorted(Comparator comp) | 产生一个新流,其中按比较器顺序排序 |
测试代码如下:
@Test public void test2(){ //自然排序 emps.stream() //String实现了comparable接口 .map(Employee::getName) .sorted() .forEach(System.out::println); System.out.println("------------------------------------"); //定制排序 emps.stream() .sorted((x, y) -> { if(x.getAge() == y.getAge()){ return x.getName().compareTo(y.getName()); }else{ return Integer.compare(x.getAge(), y.getAge()); } }).forEach(System.out::println); } // 如下是三种排序写法 resultDataList.stream().sorted(new Comparator<Person>() { @Override public int compare(JSONObject o1, JSONObject o2) { return o1.getAget.compareTo(o2.getAge); } }); resultDataList.stream().sorted((e1, e2) -> e1.getAget.compareTo(e2.getAge)); resultDataList.stream().sorted(Comparator.comparing(Person::getAge)) //如果是比较两个字符串格式的数字大小 可以如下 sorted(Comparator.comparingInt(Integer::parseInt))
⑤ Stream终止操作
终端操作会从流的流水线生成结果。其结果可以是任何不是流的值,例如:List、Integer,甚至是void 。Stream终止操作主要有查询与匹配、归约和收集。
查找与匹配
方法 | 描述 |
boolean allMatch(Predicate p) | 检查是否匹配所有元素 |
boolean anyMatch(Predicate p) | 检查是否至少匹配一个元素 |
boolean noneMatch(Predicate p) | 检查是否没有匹配所有元素 |
Optional<T> findFirst() |
返回第一个元素 |
Optional<T> findAny() |
返回当前流中的任意元素 |
long count() | 返回流中元素总数 |
Optional<T> max(Comparator c) |
返回流中最大值 |
Optional<T> min(Comparator c) |
返回流中最小值 |
void forEach(Consumer c) | 内部迭代(使用Collection 接口需要用户去做迭代, 称为外部迭代 相反,Stream API 使用内部迭代——它帮你把迭代做了) |
测试代码如下:
@Test public void test1(){ //allMatch boolean bl = emps.stream() .allMatch((e) -> e.getStatus().equals(Status.BUSY)); System.out.println(bl); //anyMatch boolean bl1 = emps.stream() .anyMatch((e) -> e.getStatus().equals(Status.BUSY)); System.out.println(bl1); //noneMatch boolean bl2 = emps.stream() .noneMatch((e) -> e.getStatus().equals(Status.BUSY)); System.out.println(bl2); } @Test public void test2(){ //findFirst Optional<Employee> op = emps.stream() .sorted((e1, e2) -> Double.compare(e1.getSalary(), e2.getSalary())) .findFirst(); System.out.println(op.get()); System.out.println("--------------------------------"); //findAny Optional<Employee> op2 = emps.parallelStream() .filter((e) -> e.getStatus().equals(Status.FREE)) .findAny(); System.out.println(op2.get()); } @Test public void test3(){ long count = emps.stream() .filter((e) -> e.getStatus().equals(Status.FREE)) .count(); System.out.println(count); //获取最大工资 Optional<Double> op = emps.stream() .map(Employee::getSalary) .max(Double::compare); System.out.println(op.get()); //获取最小工资人 Optional<Employee> op2 = emps.stream() .min((e1, e2) -> Double.compare(e1.getSalary(), e2.getSalary())); System.out.println(op2.get()); }
需要注意的是流进行了终止操作后,不能再次使用。
测试代码如下:
@Test public void test4(){ Stream<Employee> stream = emps.stream() .filter((e) -> e.getStatus().equals(Status.FREE)); //终止操作 long count = stream.count(); //再次使用流 stream.map(Employee::getSalary) .max(Double::compare); }
归约
方法 | 描述 |
T reduce(T iden, BinaryOperator<T> b) |
可以将流中元素反复结合起来,得到一个值。返回T |
Optional<T> reduce(BinaryOperator<T> b) |
可以将流中元素反复结合起来,得到一个值。返回Optional<T> |
备注:map 和reduce 的连接通常称为map-reduce 模式,因Google 用它来进行网络搜索而出名。
测试代码如下:
@Test public void test1(){ List<Integer> list = Arrays.asList(1,2,3,4,5,6,7,8,9,10); //将10个数字相加求和 Integer sum = list.stream() .reduce(0, (x, y) -> x + y); System.out.println(sum); System.out.println("----------------------------------------"); //求和员工薪水 Optional<Double> op = emps.stream() .map(Employee::getSalary) .reduce(Double::sum); System.out.println(op.get()); }
收集
方法 | 描述 |
collect(Collector c) | 将流转换为其他形式。接收一个Collector接口的实现, 用于给Stream中元素做汇总的方法 |
Collector接口中方法的实现决定了如何对流执行收集操作(如收集到List、Set、Map)。但是Collectors 实用类提供了很多静态方法,可以方便地创建常见收集器实例,具体方法与实例如下表:
方法 | 返回类型 | 描述 |
toList | List<T> |
把流中元素收集到List |
toSet | Set<T> |
把流中元素收集到Set |
toCollection | Collection<T> |
把流中元素收集到创建的集合 |
counting | Long | 计算流中元素的个数 |
summingInt | Integer | 对流中元素的整数属性求和 |
averagingInt | Double | 计算流中元素Integer属性的平均值 |
summarizingInt | IntSummaryStatistics | 收集流中Integer属性的统计值。如:平均值 |
joining | String | 连接流中每个字符串 |
maxBy | Optional<T> |
根据比较器选择最大值 |
minBy | Optional<T> |
根据比较器选择最小值 |
reducing | 归约产生的类型 | 从一个作为累加器的初始值开始,利用BinaryOperator与流中元素逐个结合,从而归约成单个值 |
collectingAndThen | 转换函数返回的类型 | 包裹另一个收集器,对其结果转换函数 |
groupingBy | Map<K,List<T>> |
根据某属性值对流分组,属性为K,结果为V |
partitioningBy | Map<Boolean,List<T>> |
根据true或false进行分区 |
toList,toSet,toCollection测试代码如下:
@Test public void test3(){ //Collectors.toList() List<String> list = emps.stream() .map(Employee::getName) .collect(Collectors.toList()); list.forEach(System.out::println); System.out.println("----------------------------------"); //Collectors.toSet() Set<String> set = emps.stream() .map(Employee::getName) .collect(Collectors.toSet()); set.forEach(System.out::println); System.out.println("----------------------------------"); //Collectors.toCollection(HashSet::new) HashSet<String> hs = emps.stream() .map(Employee::getName) .collect(Collectors.toCollection(HashSet::new)); hs.forEach(System.out::println); }
组函数测试代码如下:
@Test public void test4(){ //最大值 Optional<Double> max = emps.stream() .map(Employee::getSalary) .collect(Collectors.maxBy(Double::compare)); System.out.println(max.get()); //最小值-人 Optional<Employee> op = emps.stream() .collect(Collectors.minBy((e1, e2) -> Double.compare(e1.getSalary(), e2.getSalary()))); System.out.println(op.get()); //求和 Double sum = emps.stream() .collect(Collectors.summingDouble(Employee::getSalary)); System.out.println(sum); //平均值 Double avg = emps.stream() .collect(Collectors.averagingDouble(Employee::getSalary)); System.out.println(avg); //统计 Long count = emps.stream() .collect(Collectors.counting()); System.out.println(count); System.out.println("--------------------------------------------"); DoubleSummaryStatistics dss = emps.stream() .collect(Collectors.summarizingDouble(Employee::getSalary)); //dss.getMax(),dss.getMin(),dss.getAverage(),dss.getCount(),dss.getSum() System.out.println(dss.getMax()); }
分组测试代码如下:
@Test public void test5(){ Map<Status, List<Employee>> map = emps.stream() .collect(Collectors.groupingBy(Employee::getStatus)); System.out.println(map); } //多级分组 @Test public void test6(){ Map<Status, Map<String, List<Employee>>> map = emps.stream() .collect(Collectors.groupingBy(Employee::getStatus, Collectors.groupingBy((e) -> { if(e.getAge() >= 60) return "老年"; else if(e.getAge() >= 35) return "中年"; else return "成年"; }))); System.out.println(map); }
根据条件分为true/false两个区:
@Test public void test7(){ Map<Boolean, List<Employee>> map = emps.stream() .collect(Collectors.partitioningBy((e) -> e.getSalary() >= 5000)); System.out.println(map); }
joining-字符连接:
@Test public void test8(){ String str = emps.stream() .map(Employee::getName) .collect(Collectors.joining("," , "----", "----")); //----李四,张三,王五,赵六,赵六,赵六,田七---- System.out.println(str); }
【6】并行流与串行流
并行流就是把一个内容分成多个数据块,并用不同的线程分别处理每个数据块的流。并行流就是把一个内容(数组或集合)分成多个数据块,并用不同的线程分别处理每个数据块的流。这样一来,你就可以自动把给定操作的工作负荷分配给多核处理器的所有内核,让他们都忙起来。整个过程无需程序员显示实现优化。
Java 8 中将并行进行了优化,我们可以很容易的对数据进行并行操作。Stream API 可以声明性地通过parallel() 与sequential() 在并行流与顺序流之间进行切换。
如下所示,分别使用三种不同方法测试0L-10000000000L累加和:
//使用普通for循环 @Test public void test2(){ long start = System.currentTimeMillis(); long sum = 0L; for (long i = 0L; i <= 10000000000L; i++) { sum += i; } System.out.println(sum); long end = System.currentTimeMillis(); //3146 System.out.println("耗费的时间为: " + (end - start)); } //使用parallel并行流 @Test public void test3(){ long start = System.currentTimeMillis(); Long sum = LongStream.rangeClosed(0L, 10000000000L) .parallel() .sum(); System.out.println(sum); long end = System.currentTimeMillis(); //1703 System.out.println("耗费的时间为: " + (end - start)); //2061-2053-2086-18926 } //使用sequential串行流 @Test public void test4(){ long start = System.currentTimeMillis(); Long sum = LongStream.rangeClosed(0L, 10000000000L) .sequential() .sum(); System.out.println(sum); long end = System.currentTimeMillis(); //4602 System.out.println("耗费的时间为: " + (end - start)); //2061-2053-2086-18926 }
可以发现本例中运行效率:串行流<普通for循环<并行流
。
parallel()并行流的底层实际是Fork/Join框架,JDK1.8中对其做了改进,提供了一个公共的ForkJoinPool用于完成ForkJoinPoolTask。