文档备案控制台

开发者社区问答正文

为什么parallelStream在将它们包装在ArrayList中，在可以工作时并没有运行？

哈希图具有两个键和值对，它们不会由不同的线程并行处理。

import java.util.stream.Stream;
import java.util.Map;
import java.util.HashMap;

class Ideone
{
    public static void main (String[] args) throws java.lang.Exception
    {
        Map<String, Integer> map = new HashMap<>();
        map.put("a", 1);
        map.put("b", 2);
        map.values().parallelStream()
              .peek(x -> System.out.println("processing "+x+" in "+Thread.currentThread()))
              .forEach(System.out::println);
    }
}

输出：

processing 1 in Thread[main,5,main]
1
processing 2 in Thread[main,5,main]
2

网址：https：//ideone.com/Hkxkoz

ValueSpliterator应该尝试将HashMap数组拆分为大小为1的插槽，这意味着应在不同的线程中处理两个元素。

来源：https : //www.codota.com/code/java/methods/java8.util.HMSpliterators $ ValueSpliterator /％3Cinit％3E

将它们包装后ArrayList，它会按预期工作。

new ArrayList(map.values()).parallelStream()
              .peek(x -> System.out.println("processing "+x+" in "+Thread.currentThread()))
              .forEach(System.out::println);

输出：

processing 1 in Thread[ForkJoinPool.commonPool-worker-3,5,main]
1
processing 2 in Thread[main,5,main]
2

展开

收起

垚tutu 2019-11-28 18:50:18 723 版权

版权声明：本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

阿里云 AI 助理回答

在Java中，HashMap的并行流处理行为可能并不会如预期那样将每个元素分配到不同的线程中执行，尤其是当集合较小或者操作较快时。这是因为Java的Fork/Join框架（用于实现并行流）有一定的开销，对于小规模数据集，这个开销可能会超过并行处理带来的收益，因此它可能会选择不进行真正的并行处理，而是直接在主线程中顺序执行。

在您的示例中，直接对HashMap的.values()使用parallelStream()时，两个值的处理都发生在同一个线程中，即主线程。这是因为默认的并行策略评估了任务的大小和复杂度后决定不进行拆分。

而当您将HashMap的值放入一个新的ArrayList后再进行并行流处理时，观察到了不同的行为，即两个元素分别在主线程和一个ForkJoinPool的工作线程中处理。这说明在这种情况下，集合转换为ArrayList后，其并行流的拆分策略或初始化条件导致了并行处理的发生。

需要注意的是，并行处理的确切行为会受到JVM的具体实现、运行时环境、可用处理器数量等多种因素的影响，因此并不保证每次都会得到相同的结果分布。此外，Java 8及之后版本中的并行流设计主要是为了利用多核CPU提高处理大规模数据集的效率，对于小规模数据，通常建议使用顺序流以减少并行开销。

如果您希望确保在阿里云产品环境中利用并行流高效且一致地处理数据，可以考虑以下几点：

数据量：确保数据集足够大，以使得并行处理的开销被处理速度的提升所抵消。
自定义拆分器：如果默认的拆分逻辑不满足需求，可以探索自定义 Spliterator 来更细粒度地控制数据的分割方式。
使用并发容器：虽然在这个例子中不适用，但在某些场景下，使用如ConcurrentHashMap这样的并发容器能更好地支持高并发下的读写操作。
环境配置：检查和调整JVM的并行参数，比如通过设置-Djava.util.concurrent.ForkJoinPool.common.parallelism来调整ForkJoinPool的并行度。
监控与调优：在阿里云ECS或容器服务等环境中，利用监控工具（如Arms）来观察应用性能，根据实际情况调整并行处理策略。

最后，考虑到实际应用中数据处理的复杂性和多样性，建议根据具体业务场景和性能测试结果来决定是否以及如何使用并行流。

有帮助

无帮助

AI 助理回答生成答案可能存在不准确，仅供参考

0 条回答

写回答

取消提交回答

问答分类：

Java

问答地址：

开发者社区 > 开发与运维 > 问答

相关问答

空间如何支持这些函数

34234

22

0

通过www和不带www的网址输入最终都指向www.我的域名.com，求指教

139965

45

0

购买阿里国外的云服务器是否可以访问谷歌？

85224

48

0

访问ECS服务器的网站提示“由于你访问的URL可能对网站造成安全威胁，您的访问被阻断”，这是什么原因？

129399

15

0

【阿里云运维部署工具AppDeploy详细教程】之4：应用部署

39717

6

0

阿里云服务器续费后一直处于启动中状态，服务器打不开了怎么解决？？？

36376

6

0

域名在腾讯云备案成功，解析到阿里云服务器，提示仍需备案？

61570

32

0

请问下我访问接口不通什么原因 Provisional headers are shown

4342

2

0

如何加速中国访问美国云的服务器访问速度

31955

8

0

this xml file does not appear to have any style in

52759

10

0

问答排行榜

最热

最新

【大咖问答】对话PostgreSQL 中国社区发起人之一，阿里云数据库高级专家德哥

据说在家办公的程序员是这样写代码的？

如何升级配置

【藏经阁一起读（27）】本周推荐《Apache Flink案例集（2022版）》，你有哪些心得？

【精品问答】python技术1000问(1)

现在还能免费部署模型至api上了吗？

更新太慢了,模型也要赶紧优化

如何获取阿里云服务器的优惠折扣？

通义灵码提示格式问题

modelscope 部署模型资源好久了，一直没响应，这应该怎么删除重新部署呢？

相关文章

蓝易云：在Ubuntu 18.04上安装与JDK 8兼容的Eclipse版本的步骤。

新书《鸿蒙HarmonyOS 6应用开发：从零基础到App上线》出版啦

守住 Java AI 生命线：优先级与熔断降级工程化实战

倍莱鲜羊奶新零售商城软件开发

告别 MyBatis？dbVisitor 如何以现代设计重塑 Java 数据访问层

还有其他疑问?