Collector 的 Javadoc展示了如何将流的元素收集到一个新的 List 中。是否有一种方法可以将结果添加到现有的 ArrayList 中?
注意: nosid 的答案显示了如何使用forEachOrdered(). 这是改变现有集合的有用且有效的技术。我的回答解决了为什么您不应该使用aCollector来改变现有集合。
forEachOrdered()
Collector
据我所知,到目前为止,所有其他答案都使用收集器将元素添加到现有流中。但是,有一个更短的解决方案,它适用于顺序流和并行流。您可以简单地将forEachOrdered方法与方法引用结合使用。
List<String> source = ...; List<Integer> target = ...; source.stream() .map(String::length) .forEachOrdered(target::add);
唯一的限制是,源和目标是不同的列表,因为只要处理了流,就不允许您更改流的源。
请注意,此解决方案适用于顺序流和并行流。但是,它并不能从并发中受益。传递给forEachOrdered的方法引用将始终按顺序执行。
简短的回答是 no ,至少在一般情况下,您不应该使用 aCollector来修改现有集合。
原因是收集器被设计为支持并行性,即使在不是线程安全的集合上也是如此。他们这样做的方式是让每个线程独立地操作自己的中间结果集合。每个线程获取自己的集合的方式是调用每次Collector.supplier()返回 新集合所需的。
Collector.supplier()
然后将这些中间结果集合再次以线程限制的方式合并,直到有一个结果集合。这是collect()操作的最终结果。
collect()
Balder和assylias的几个答案建议使用Collectors.toCollection()然后传递一个返回现有列表而不是新列表的供应商。这违反了对供应商的要求,即每次都返回一个新的空集合。
Collectors.toCollection()
正如他们答案中的示例所展示的那样,这将适用于简单的情况。但是,它会失败,特别是如果流是并行运行的。(库的未来版本可能会以某种无法预料的方式发生变化,这将导致它失败,即使在顺序情况下也是如此。)
我们举一个简单的例子:
List<String> destList = new ArrayList<>(Arrays.asList("foo")); List<String> newList = Arrays.asList("0", "1", "2", "3", "4", "5"); newList.parallelStream() .collect(Collectors.toCollection(() -> destList)); System.out.println(destList);
当我运行这个程序时,我经常得到一个ArrayIndexOutOfBoundsException. 这是因为多个线程正在运行ArrayList,一个线程不安全的数据结构。好的,让我们让它同步:
ArrayIndexOutOfBoundsException
ArrayList
List<String> destList = Collections.synchronizedList(new ArrayList<>(Arrays.asList("foo")));
这将不再因异常而失败。但不是预期的结果:
[foo, 0, 1, 2, 3]
它给出了如下奇怪的结果:
[foo, 2, 3, foo, 2, 3, 1, 0, foo, 2, 3, foo, 2, 3, 1, 0, foo, 2, 3, foo, 2, 3, 1, 0, foo, 2, 3, foo, 2, 3, 1, 0]
这是我上面描述的线程限制累积/合并操作的结果。使用并行流,每个线程调用供应商以获取自己的集合以进行中间累积。如果您传递返回 相同 集合的供应商,则每个线程都会将其结果附加到该集合。由于线程之间没有顺序,结果将以任意顺序附加。
然后,当这些中间集合合并时,这基本上将列表与自身合并。使用 合并列表List.addAll(),这表示如果在操作期间修改了源集合,则结果未定义。在这种情况下,ArrayList.addAll()执行数组复制操作,所以它最终会复制自己,我猜这是人们所期望的。(请注意,其他 List 实现可能具有完全不同的行为。)无论如何,这解释了目标中的奇怪结果和重复元素。
List.addAll()
ArrayList.addAll()
您可能会说,“我将确保按顺序运行我的流”并继续编写这样的代码
stream.collect(Collectors.toCollection(() -> existingList))
反正。我建议不要这样做。如果您控制流,当然,您可以保证它不会并行运行。我预计会出现一种编程风格,其中流而不是集合。如果有人递给您一个流并且您使用此代码,那么如果流恰好是并行的,它将失败。更糟糕的是,有人可能会给你一个顺序流,这段代码会在一段时间内正常工作,通过所有测试等。然后,一段时间后,系统中其他地方的代码可能会更改为使用并行流,这将导致 你的 代码打破。
好的,那么请务必记住sequential()在使用此代码之前调用任何流:
sequential()
stream.sequential().collect(Collectors.toCollection(() -> existingList))
当然,你会记得每次都这样做,对吧?:-) 假设你这样做。然后,性能团队会想知道为什么他们所有精心设计的并行实现都没有提供任何加速。他们再次将其追溯到 您的 代码,这迫使整个流按顺序运行。
不要这样做。