Parallel Stream(并行流)
在前面小节中,介绍的创建Stream流对象的3种方式都是创建的串行流(Serial Stream),所谓串行流就是将源数据转换为一个流对象,然后在单线程下执行聚合操作的流(也就是单一管道流)。而JDK 8中针对大批量的数据处理还提供了一个并行流(Parallel Stream),并行流就是将源数据分为多个子流对象进行多线程操作(也就是多个管道流),然后将处理的结果再汇总为一个流对象。
接下来,就通过一个简单的示意图来展示Stream串行流与并行流的主要区别,如图1所示。
图1 Stream串行流与并行流示意图
Stream并行流底层会将源数据拆解为多个流对象在多个线程中并行执行,这依赖于JDK 7中新增的fork/join框架,该框架解决了应用程序并行计算的能力,但是单独使用这个框架,必须指定源数据如何进行详细拆分,而JDK 8中的聚合操作,在fork/join框架的基础上进行组合解决了这一麻烦。
使用Stream并行流在一定程度上可以提升程序的执行效率,但是在多线程执行就会出现线程安全这个大问题,所以为了能够在聚合操作中使用Stream并行流,前提是要执行操作的源数据在并行执行过程中不会被修改。
在创建Stream流对象时,除非有特别声明,否则默认创建的都是串行流。JDK 8中提供了两种方式来创建Stream并行流:第一种方式,通过Collection集合接口的parallelStream()方法直接将集合类型的源数据转变为Stream并行流;第二种方式,通过BaseStream接口的parallel()方法将Stream串行流转变为Stream并行流。另外,在BaseStream接口中还提供了一个isParallel()方法,用于判断当前Stream流对象是否为并行流,方法返回值为boolean类型。
接下来,通过一个案例来学习聚合操作中Stream并行流的创建和基本使用,如文件1所示。
文件1 Example38.java
1 import java.util.*;
2 import java.util.stream.Stream;
3 public class Example38 {
4 public static void main(String[] args) {
5 // 创建一个List集合数据源
6 List<String> list = Arrays.asList("张三","李四","张小明","张阳");
7 // 1、直接使用Collection接口的parallelStream()创建并行流
8 Stream<String> parallelStream = list.parallelStream();
9 System.out.println(parallelStream.isParallel());
10 // 创建一个Stream串行流
11 Stream<String> stream = Stream.of("张三","李四","张小明","张阳");
12 // 2、使用BaseStream接口的parallel()方法将串行流转变为并行流
13 Stream<String> parallel = stream.parallel();
14 System.out.println(parallel.isParallel());
15 }
16 }
运行结果如图2所示。
图2 运行结果
文件1中,分别使用两种方式创建了Stream并行流,并通过isParallel()方法验证了创建后的流对象是否为并行流。另外,不论是Stream并行流还是串行流,都属于Stream流对象,所以它们都拥有相同的流操作方法,这里就不再进行演示说明了。