文档备案控制台

开发者社区问答正文

MaxCompute Spark中Driver Memory的原因及解决方案是什么？

MaxCompute Spark中Driver Memory的原因及解决方案是什么？

展开

收起

芯在这 2021-12-12 22:59:48 1065 版权

版权声明：本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

1 条回答

写回答

取消提交回答

真的很搞笑

代码可能使用了collect操作将过大的数据集收集到Driver节点

在代码创建了过大的数组，或者加载过大的数据集到Driver进程汇总

SparkContext，DAGScheduler都是运行在Driver端的。对应rdd的Stage切分也是在Driver端运行，如果用户自己写的程序有过多的步骤，切分出过多的Stage，这部分信息消耗的是Driver的内存，这个时候就需要调大Driver的内存。有时候如果stage过多，Driver端甚至会有栈溢出

2021-12-12 23:00:18

赞同展开评论

问答分类：

分布式计算 MaxCompute Spark 云原生大数据计算服务 MaxCompute

问答标签：

云原生大数据计算服务 MaxCompute解决方案云原生大数据计算服务 MaxCompute spark apache spark MaxCompute 云原生大数据计算服务 MaxCompute memory apache spark driver

问答地址：

开发者社区 > 大数据 > 问答

相关问答

DataWorks我们的业务需求是同步一个rds的所有库到odps，请问这种场景有合适的解决方案吗？

199

4

0

DataWorks想实现 maxcompute中的表与mysql中的表数据一致有解决方案吗？

105

1

0

我知道这个可能是由于list数据类型引起的。大数据计算MaxCompute这个有解决方案吗？

165

2

0

PolarDB单张大数据表历史迁移解决方案

95

0

0

MaxCompute spark作业报错Cannot allocate memory

109

0

0

需求是powerbi直连大数据计算MaxCompute有什么解决方案？

189

1

0

咨询一下，源是阿里云公有云大数据计算MaxCompute，有没有比较合适的解决方案？

94

0

0

在阿里云OpenAPI我们的odps仅支持py3.7，有解决方案吗？

115

1

0

大数据计算MaxCompute pyodps=0.10.7.1 大家有解决方案吗？

136

3

0

DataWorks中lindorm冷数据同步至MaxCompute 有解决方案吗？

174

3

0

问答排行榜

最热

最新

【大咖问答】对话PostgreSQL 中国社区发起人之一，阿里云数据库高级专家德哥

据说在家办公的程序员是这样写代码的？

如何升级配置

【藏经阁一起读（27）】本周推荐《Apache Flink案例集（2022版）》，你有哪些心得？

【精品问答】python技术1000问(1)

现在还能免费部署模型至api上了吗？

更新太慢了,模型也要赶紧优化

如何获取阿里云服务器的优惠折扣？

通义灵码提示格式问题

modelscope 部署模型资源好久了，一直没响应，这应该怎么删除重新部署呢？

相关文章

有奖实践：EMR Serverless StarRocks × Serverless Spark x DLF 共探 TPC 极致性能

别再把 Spark / Dask 当“放大版 Pandas”了——聊聊大规模特征计算那些真能救命的技巧

训练时一套，线上跑一套？离线训练与在线服务数据一致性这坑，我替你踩过了

阿里云企业级云服务器：c9i、g9i、r9i实例的性能、适用场景与选型参考

阿里云服务器4核8G、8核16G、8核32G等配置租用活动价格与实例规格选择参考

还有其他疑问?