Java Stream 是 Java 8 引入的一种新功能,旨在简化集合操作和数据处理。Stream API 提供了一种声明性的方法来处理数据集合,使代码更加简洁和易读。下面将深入解析 Java Stream 编程,包括其基本概念、常用操作和一些高级用法。
基本概念
什么是 Stream?
Stream 是一个允许你以声明性方式(类似于 SQL 语句)处理数据序列的抽象。Stream 并不是数据结构,它不存储数据,而是从数据源(如集合、数组、I/O channel,生成器等)获取数据并进行某种操作。
特性
- 无存储:Stream 不存储数据,只是对原数据的操作视图。
- 函数式编程:Stream 支持使用 lambda 表达式进行操作。
- 惰性求值:Stream 操作是惰性执行的,只有在需要结果的时候才会执行。
- 可并行化:Stream 可以轻松地并行化,利用多核处理器。
创建 Stream
从集合创建
List<String> list = Arrays.asList("a", "b", "c");
Stream<String> stream = list.stream();
从数组创建
String[] array = {
"a", "b", "c"};
Stream<String> stream = Arrays.stream(array);
使用 Stream.of
Stream<String> stream = Stream.of("a", "b", "c");
从文件创建
try (Stream<String> lines = Files.lines(Paths.get("file.txt"))) {
// 处理文件行
}
常用操作
Stream 操作分为两类:中间操作和终端操作。
中间操作
中间操作返回一个新的 Stream,它们是惰性求值的,即不会立刻执行,直到遇到终端操作。
filter: 筛选
List<String> result = list.stream() .filter(s -> s.startsWith("a")) .collect(Collectors.toList());
map: 映射
List<Integer> lengths = list.stream() .map(String::length) .collect(Collectors.toList());
flatMap: 扁平化
List<String> list = Arrays.asList("a,b,c", "d,e,f"); List<String> result = list.stream() .flatMap(s -> Arrays.stream(s.split(","))) .collect(Collectors.toList());
sorted: 排序
List<String> sortedList = list.stream() .sorted() .collect(Collectors.toList());
distinct: 去重
List<String> distinctList = list.stream() .distinct() .collect(Collectors.toList());
limit 和 skip: 截取
List<String> limitedList = list.stream() .limit(2) .collect(Collectors.toList());
终端操作
终端操作会触发 Stream 的惰性求值,并且会关闭 Stream。
forEach: 遍历
list.stream().forEach(System.out::println);
collect: 收集
List<String> collectedList = list.stream() .collect(Collectors.toList());
reduce: 归约
Optional<String> concatenated = list.stream() .reduce((s1, s2) -> s1 + s2);
count: 计数
long count = list.stream().count();
anyMatch, allMatch, noneMatch: 匹配
boolean anyStartsWithA = list.stream().anyMatch(s -> s.startsWith("a"));
findFirst, findAny: 查找
Optional<String> first = list.stream().findFirst();
高级用法
并行流
通过 parallelStream
创建并行流,可以利用多核处理器并行处理数据:
List<String> list = Arrays.asList("a", "b", "c");
list.parallelStream().forEach(System.out::println);
自定义收集器
可以创建自定义的收集器来处理复杂的收集需求。Collectors 提供了各种内置的收集器,如 toList
, toSet
, joining
等:
List<String> list = Arrays.asList("a", "b", "c");
String result = list.stream()
.collect(Collectors.joining(", "));
分组和分区
利用 Collectors.groupingBy
和 Collectors.partitioningBy
进行分组和分区:
Map<Integer, List<String>> groupedByLength = list.stream()
.collect(Collectors.groupingBy(String::length));
Map<Boolean, List<String>> partitionedByLength = list.stream()
.collect(Collectors.partitioningBy(s -> s.length() > 1));
总结
Java Stream API 提供了一种强大而简洁的方式来处理集合和数据流。通过学习和掌握 Stream 的基本操作和高级用法,能够极大地提升代码的可读性和开发效率。在实际应用中,熟练使用 Stream 可以使数据处理任务变得更加简单和直观。