文档备案控制台

开发者社区大数据与机器学习大数据计算 MaxCompute 正文

大数据计算MaxCompute这是发生数据倾斜了吗？

大数据计算MaxCompute这是发生数据倾斜了吗？我的sql如下set odps.sql.unstructured.oss.commit.mode =true;
set odps.sql.mapper.split.size=256;
set odps.sql.metering.value.max=1500;
set odps.stage.mapper.mem = 2048;
set odps.stage.mapper.jvm.mem = 4096;
insert OVERWRITE TABLE dwd_oss_risk3_service_et_di PARTITION(pt,country,app_type)
select * from dwd_risk3_service_et_di
where app_type !='third'
and pt<'2024-03-01'
and pt>='2024-02-01'
这是报错信息

展开

收起

真的很搞笑 2024-03-21 07:45:18 272 版权

版权声明：本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

2 条回答

写回答

取消提交回答

历年考试不作弊

根据您提供的SQL语句和报错信息，无法确定是否发生了数据倾斜。数据倾斜是指数据在分布式计算过程中不均匀地分布在各个节点上，导致某些节点处理的数据量过大而其他节点处理的数据量过小，从而影响整体的计算效率。

要判断是否发生了数据倾斜，需要查看具体的报错信息以及集群的资源使用情况。通常，数据倾斜会导致某些节点的CPU、内存或磁盘I/O等资源被大量占用，从而导致作业运行时间延长或失败。

建议您检查MaxCompute的日志和监控信息，以获取更多关于数据倾斜的详细信息。此外，您还可以尝试调整SQL语句中的分区键、过滤条件或优化查询逻辑，以减少数据倾斜的可能性。

2024-03-31 21:35:07

赞同展开评论
芯在这

oom了。调整一下这几个flag
set odps.stage.mapper.mem=8192; // 默认2048
set odps.stage.reducer.mem=8192; // 默认2048
set odps.stage.joiner.mem=8192; // 默认2048
少用udf或者不用，这几个值最大可以设置到12288
如果还不行，就只能单独导入了。你的数据量太大了。还不行就试试加点reduce.num 的数量，set odps.stage.reducer.num =xxx; ，此回答整理自钉群“MaxCompute开发者社区2群”

2024-03-21 08:45:12

赞同展开评论

问答分类：

分布式计算 MaxCompute 大数据 SQL 云原生大数据计算服务 MaxCompute 对象存储

问答地址：

开发者社区 > 大数据与机器学习 > 大数据计算 MaxCompute > 问答

相关问答

请问大数据计算MaxCompute有没有官方的调优文档可以看下呢?

329

3

0

大数据计算MaxCompute schema复制多了还不行这是什么限制?

245

2

0

大数据计算MaxCompute 如果想实现A[:N]这种指定元素个数的取法可以咋写?

369

2

0

大数据计算MaxCompute ||在什么环境下表示字符串拼接？

344

2

0

请问下大数据计算MaxCompute离线同步节点会自动移除字段的前后空格吗？

267

2

0

大数据计算MaxCompute我这边想更改字段长度报错了？

863

3

0

在大数据计算MaxCompute中，dataworks 、maxcompute有无最新的视频教程？

221

1

0

什么是大数据SQL数据倾斜？

213

1

0

在大数据计算MaxCompute中，用哪个函数转换比较好呢？

386

4

0

在大数据计算MaxCompute中，提示参数不支持，还是白天手动补数据才可以怎么回事？

262

2

0

大数据与机器学习

大数据计算 MaxCompute

MaxCompute（原ODPS）是一项面向分析的大数据计算服务，它以Serverless架构提供快速、全托管的在线数据仓库服务，消除传统数据平台在资源扩展性和弹性方面的限制，最小化用户运维投入，使您经济并高效的分析处理海量数据。

我要提问

相关文章

Google BigQuery 在阿里云上最接近什么产品？AnalyticDB MySQL Serverless 与 MaxCompute 如何选

AI Agent 数据分析平台是什么？与BI、传统分析工具有何不同？

AWS EMR 上的 Spark 作业迁到阿里云用什么？AnalyticDB MySQL 湖仓版 Serverless Spark 免运维替代方案

AnalyticDB MySQL 湖仓版 Serverless Spark vs EMR Spark：免运维、弹性与成本全维度对比

从 Google BigQuery 迁移到阿里云怎么选型？AnalyticDB MySQL 迁移实战指南

相关解决方案

更多

基于数据闪回，快速恢复数据

海量异构数据预处理破局之道

分析 Agent 实现一键 AI 数据洞察

多模态数据信息提取

高效存储和处理多媒体数据

热门讨论

热门文章

ODPS 的下一个15年，大数据将迎来春天还是寒冬？

问一下我现在使用大数据计算MaxCompute，容量不足，申请了存储空间，发给我一个tenanid?

为什么在大数据计算MaxCompute生产环境的结果中看到，所有的除零的结果都变成了NULL？

大数据计算MaxCompute该字段类型从tinyint改为Int,怎么修改?

大数据计算MaxCompute这种mapjoin构建hash table时间很长，有什么优化方向吗?

在大数据计算MaxCompute有碰到不同的字段顺序，存储大小差很多的例子吗？

请问一下大数据计算MaxCompute，支持的records数据类型是什么？

在大数据计算MaxCompute中，有没有for循环类似的函数？

在导航栏无法定位到相关文件，在运维中心点击编辑节点，可以定位，但无法保存提交，请问是什么原因导致

比如我有大数据计算MaxCompute我有一个表存配置天数 days，这个可以实现吗？

展开全部

odps是什么?

MaxCompute执行作业慢的原因排查

阿里云MaxCompute（大数据）公开数据集---带你玩转人工智能

优酷背后的大数据秘密

Python+大数据计算平台，PyODPS架构手把手教你搭建

【转载】时隔一年多，我又用起了 Superset

品《阿里巴巴大数据实践-大数据之路》一书（上）

干货：解码OneData，阿里的数仓之路。

[大数据新手上路]“零基础”系列课程--如何将ECS上的Hadoop数据迁移到阿里云数加·MaxCompute

阿里数据仓库实践分享

展开全部

还有其他疑问?