java – Stream.spliterator对并行流的奇怪行为

我正在使用流分裂器直接用于我正在编写的库中的低级操作.最近,当我使用流分裂器和交错tryAdvance / trySplit调用时,我发现了非常奇怪的行为.这是一个简单的代码,演示了这个问题:

import java.util.Arrays;
import java.util.Spliterator;

public class SpliteratorBug {
    public static void main(String[] args) {
        Integer[][] input = { { 1 }, { 2, 3 }, { 4, 5, 6 }, { 7, 8 }, { 9 } };
        Spliterator<Integer> spliterator = Arrays.stream(input).parallel()
                .flatMap(Arrays::stream).spliterator();
        spliterator.trySplit();
        spliterator.tryAdvance(s -> {});
        spliterator.trySplit();
        spliterator.forEachRemaining(System.out::println);
    }
}

输出是

5
6
9

正如您所看到的,在平面映射之后,我应该得到从1到9的连续数字的有序流.我将分裂器拆分一次,因此它应该跳转到某个中间位置.接下来我从中消耗一个元素并将其拆分一次.之后我打印所有剩余的元素.我希望我将从流尾部有几个连续的元素(可能是零元素,它也会很好).然而我得到的是5和6,然后突然跳到9.

我知道目前在JDK分裂器中并没有这样使用:它们总是在遍历之前分裂.但官方documentation并未明确禁止在tryAdvance之后调用trySplit.

当我使用直接从集合,数组,生成的源等创建的spliterator时,从未观察到这个问题.只有当spliterator是从具有中间flatMap的并行流创建时才会观察到.

所以问题是:我是否遇到了这个错误,或者明确禁止某个地方以这种方式使用分裂器?

解决方法:

从我从AbstractWrappingSpliterator和公司的源代码中可以看出,当你尝试使用它时,flatMap(4,5,6)的输出被缓冲,然后4被消耗,留下(5,6)在缓冲区中.然后trySplit正确地将(7,8)拆分为新的Spliterator,在旧的Spliterator中留下9,但缓冲的(5,6)留在旧的Spliterator中.

所以这看起来像是一个错误.它应该将缓冲区关闭到新的Spliterator或返回null并且如果缓冲区不为空则拒绝拆分.

上一篇:JDK 1.8特性 Stream是串行还是并行


下一篇:java – 并行流调用Spliterator的次数超过其限制