备案控制台

开发者社区问答正文

MaxCompute Spark中Driver Memory的原因及解决方案是什么？

MaxCompute Spark中Driver Memory的原因及解决方案是什么？

展开

收起

芯在这 2021-12-12 22:59:48 1056 版权

版权声明：本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

1 条回答

写回答

取消提交回答

真的很搞笑

代码可能使用了collect操作将过大的数据集收集到Driver节点

在代码创建了过大的数组，或者加载过大的数据集到Driver进程汇总

SparkContext，DAGScheduler都是运行在Driver端的。对应rdd的Stage切分也是在Driver端运行，如果用户自己写的程序有过多的步骤，切分出过多的Stage，这部分信息消耗的是Driver的内存，这个时候就需要调大Driver的内存。有时候如果stage过多，Driver端甚至会有栈溢出

2021-12-12 23:00:18

赞同展开评论

问答分类：

分布式计算 MaxCompute Spark 云原生大数据计算服务 MaxCompute

问答标签：

云原生大数据计算服务 MaxCompute解决方案云原生大数据计算服务 MaxCompute spark apache spark MaxCompute 云原生大数据计算服务 MaxCompute memory apache spark driver

问答地址：

开发者社区 > 大数据 > 问答

相关问答

DataWorks我们的业务需求是同步一个rds的所有库到odps，请问这种场景有合适的解决方案吗？

176

4

0

DataWorks想实现 maxcompute中的表与mysql中的表数据一致有解决方案吗？

98

1

0

我知道这个可能是由于list数据类型引起的。大数据计算MaxCompute这个有解决方案吗？

134

2

0

PolarDB单张大数据表历史迁移解决方案

82

0

0

MaxCompute spark作业报错Cannot allocate memory

91

0

0

需求是powerbi直连大数据计算MaxCompute有什么解决方案？

158

1

0

咨询一下，源是阿里云公有云大数据计算MaxCompute，有没有比较合适的解决方案？

82

0

0

在阿里云OpenAPI我们的odps仅支持py3.7，有解决方案吗？

97

1

0

大数据计算MaxCompute pyodps=0.10.7.1 大家有解决方案吗？

110

3

0

DataWorks中lindorm冷数据同步至MaxCompute 有解决方案吗？

153

3

0

问答排行榜

最热

最新

【大咖问答】对话PostgreSQL 中国社区发起人之一，阿里云数据库高级专家德哥

据说在家办公的程序员是这样写代码的？

阿里云开放端口权限

如何升级配置

【藏经阁一起读（27）】本周推荐《Apache Flink案例集（2022版）》，你有哪些心得？

阿里云短信收费标准，短信群发平台是怎么收费的？

通义灵码使用代理报错

idea通义灵码插件，更新后怎么一直用英文回答。开始对话时，告诉它之后的问题使用中文回答也不行

阿里云云企业网CEN是什么？如何使用？

阿里云全球加速GA是什么？怎么使用？

相关文章

Dataphin功能Tips系列（80）每日新增表高效同步！脚本模式+参数化配置助你轻松搞定动态数据同步

阿里云携手 MiniMax 构建云原生数仓最佳实践：大模型时代的 Data + AI 数据处理平台

阿里云通用算力型u2i与经济型e实例性能、适用场景区别及选择参考

AI战略丨大模型应用元年，让智能真正转变为生产力

主流ChatBi产品推荐，一文看懂分析agent产品选型

还有其他疑问?