备案控制台

开发者社区问答正文

MaxCompute Spark中磁盘空间不足的表现形式是什么？

MaxCompute Spark中磁盘空间不足的表现形式是什么？

展开

收起

芯在这 2021-12-12 23:03:05 939 版权

版权声明：本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

1 条回答

写回答

取消提交回答

真的很搞笑

在Executor/Driver的日志中发现了No space left on device错误

解决方案：

最简单的方法是直接增加更多的磁盘空间，调大 spark.hadoop.odps.cupid.disk.driver.device_size 如果增加到100g之后依然出现该错误，可能是由于存在数据倾斜，shuffle或者cache过程中数据集中分布在某些block，也可能是单个Executor的shuffle数据量确实过大，可以尝试：

对数据重分区，解决数据倾斜问题

增加executor的数量spark.executor.instances需要注意：

缩小读表并发spark.hadoop.odps.input.split.size

缩小单个Executor的任务并发spark.executor.cores

同样由于在JVM启动前就需要挂载磁盘，因此该参数必须配置在spark-defaults.conf文件或者dataworks的配置项中，不能配置在用户代码中

此外需要注意该参数的单位为g，不能省略g

很多时候由于用户配置位置有误或者没有带单位g，导致参数实际并没有生效，任务运行依然失败

2021-12-12 23:03:42

赞同展开评论

问答分类：

分布式计算 MaxCompute Spark 云原生大数据计算服务 MaxCompute

问答标签：

云原生大数据计算服务 MaxCompute spark apache spark MaxCompute

问答地址：

开发者社区 > 大数据 > 问答

相关问答

大数据系统（Hadoop/Spark）特点是什么？

644

1

0

spark任务想完整的部署，发布，执行调度，仅仅maxcompute组件权限够么，还需要datawo

916

1

0

spark连接odps，执行insert overwrite报错

1077

1

0

Spark 读取Maxcompute 中的表进行处理，怎么弄？

943

1

0

哪里有ODPS spark代码模版

544

1

0

我提交了一个 spark 任务，spark 里面用了 odps 的 java SDK，这时候 SDK

1554

1

0

Dataworks上的ODPS spark处理数据会比直接用ODPS SQL效率高吗？

1008

1

0

maxcompute的底层引擎我用的都是mr，他是可以切换成spark吗？

1991

1

0

jindo的sdk支持spark on odps 吗？专有云的

794

1

0

Spark能成为大数据中开源框架的原因是什么？

446

1

0

问答排行榜

最热

最新

【大咖问答】对话PostgreSQL 中国社区发起人之一，阿里云数据库高级专家德哥

据说在家办公的程序员是这样写代码的？

阿里云开放端口权限

如何升级配置

【藏经阁一起读（27）】本周推荐《Apache Flink案例集（2022版）》，你有哪些心得？

通义灵码启动异常，可点击按钮进行一键修复，如仍无法解决，请参考[问题排查指南](https://he

怎么搭建本地文生图工作流

通义灵码提示看起来我们今天已经有了很多的对话，我很感谢你的热情，但我现在需要稍微休息一下。提前抱

阿里云CDN价格表，CDN如何收费的？

CentOS 7安装最新版docker-compose-plugin（2.27.1-1.el7）报错

相关文章

XXLJOB：超长定时任务慢节点优化实践

五、Hive表类型、分区及数据加载

阿里云服务器Arm计算架构解析：主要实例规格、性能特点、适用场景与价格参考

六、Hive 分桶

九、HQL DQL七大查询子句

还有其他疑问?