引言
首先,Java 8 Streams 不应与 Java I/O 流混淆(例如:FileInputStream 等);这些彼此之间几乎没有关系。
简而言之,流是数据源的包装器,允许我们使用该数据源进行操作,并使批量处理方便快捷。
Stream不存储数据,从这个意义上说,它不是数据结构。它也从不修改底层数据源
这个功能 - java.util.stream - 支持对元素流的函数式操作,例如对集合的 map-reduce 转换。
现在让我们深入研究几个流创建和使用的简单示例——在进入术语和核心概念之前。
创建一个java流
- 已有的list转换成流对象
private static Employee[] arrayOfEmps = { new Employee(1, "Jeff Bezos", 100000.0), new Employee(2, "Bill Gates", 200000.0), new Employee(3, "Mark Zuckerberg", 300000.0) }; Stream.of(arrayOfEmps); 复制代码
private static List<Employee> empList = Arrays.asList(arrayOfEmps); empList.stream(); 复制代码
- 新建一个流
Stream.of(arrayOfEmps[0], arrayOfEmps[1], arrayOfEmps[2]); 复制代码
- 使用build
Stream.Builder<Employee> empStreamBuilder = Stream.builder(); empStreamBuilder.accept(arrayOfEmps[0]); empStreamBuilder.accept(arrayOfEmps[1]); empStreamBuilder.accept(arrayOfEmps[2]); Stream<Employee> empStream = empStreamBuilder.build(); 复制代码
Stream的操作
forEach
forEach() 是最简单最常用的操作;它遍历流元素,在每个元素上调用提供的函数。
该方法非常常见,已在 Iterable、Map 等中直接引入
@Test public void whenIncrementSalaryForEachEmployee_thenApplyNewSalary() { empList.stream().forEach(e -> e.salaryIncrement(10.0)); assertThat(empList, contains( hasProperty("salary", equalTo(110000.0)), hasProperty("salary", equalTo(220000.0)), hasProperty("salary", equalTo(330000.0)) )); } 复制代码
forEach() 是一个终端操作,也就是说,执行完操作后,流管道就被认为是消耗掉了,不能再使用了。我们将在下一节中详细讨论终端操作。
map
map() 在对原始流的每个元素应用函数后生成一个新流。新的流可以是不同的类型。
以下示例将整数流转换为雇员流
@Test public void whenMapIdToEmployees_thenGetEmployeeStream() { Integer[] empIds = { 1, 2, 3 }; List<Employee> employees = Stream.of(empIds) .map(employeeRepository::findById) .collect(Collectors.toList()); assertEquals(employees.size(), empIds.length); } 复制代码
在这里,我们从数组中获取员工 ID 的整数流。每个 Integer 都被传递给函数 employeeRepository::findById()——它返回相应的 Employee 对象;这有效地形成了一个员工流。
collect
我们在前面的例子中看到了 collect() 的工作原理;一旦我们完成所有处理,这是从流中取出内容的常用方法之一:
@Test public void whenCollectStreamToList_thenGetList() { List<Employee> employees = empList.stream().collect(Collectors.toList()); assertEquals(empList, employees); } 复制代码
collect() 对 Stream 实例中保存的数据元素执行可变折叠操作(将元素重新打包到某些数据结构并应用一些额外的逻辑,将它们连接起来等)。
此操作的策略是通过 Collector 接口实现提供的。在上面的示例中,我们使用 toList 收集器将所有 Stream 元素收集到一个 List 实例中。
filter
接下来,我们来看看 filter();这将生成一个新流,其中包含通过给定测试(由谓词指定)的原始流的元素。
让我们看看它是如何工作的:
@Test public void whenFilterEmployees_thenGetFilteredStream() { Integer[] empIds = { 1, 2, 3, 4 }; List<Employee> employees = Stream.of(empIds) .map(employeeRepository::findById) .filter(e -> e != null) .filter(e -> e.getSalary() > 200000) .collect(Collectors.toList()); assertEquals(Arrays.asList(arrayOfEmps[2]), employees); } 复制代码
在上面的示例中,我们首先过滤掉无效员工 ID 的空引用,然后再次应用过滤器以仅保留工资超过特定阈值的员工。
findFirst
ndFirst() 为流中的第一个条目返回一个 Optional; Optional 当然可以为空:
@Test public void whenFindFirst_thenGetFirstEmployeeInStream() { Integer[] empIds = { 1, 2, 3, 4 }; Employee employee = Stream.of(empIds) .map(employeeRepository::findById) .filter(e -> e != null) .filter(e -> e.getSalary() > 100000) .findFirst() .orElse(null); assertEquals(employee.getSalary(), new Double(200000)); } 复制代码
在这里,返回第一个工资大于 100000 的员工。如果不存在这样的员工,则返回 null。
toArray
我们看到了如何使用 collect() 从流中获取数据。如果我们需要从流中取出一个数组,我们可以简单地使用 toArray():
@Test public void whenStreamToArray_thenGetArray() { Employee[] employees = empList.stream().toArray(Employee[]::new); assertThat(empList.toArray(), equalTo(employees)); } 复制代码
语法 Employee[]::new 创建一个空的 Employee 数组——然后用流中的元素填充。
flatMap
流可以包含复杂的数据结构,例如 Stream<List>。在这种情况下,flatMap() 可以帮助我们扁平化数据结构以简化进一步的操作:
@Test public void whenFlatMapEmployeeNames_thenGetNameStream() { List<List> namesNested = Arrays.asList( Arrays.asList("Jeff", "Bezos"), Arrays.asList("Bill", "Gates"), Arrays.asList("Mark", "Zuckerberg"));
List<String> namesFlatStream = namesNested.stream() .flatMap(Collection::stream) .collect(Collectors.toList()); assertEquals(namesFlatStream.size(), namesNested.size() * 2); 复制代码
请注意我们如何能够将 Stream<List> 转换为更简单的 Stream - 使用 flatMap() API