备案控制台

开发者社区大数据与机器学习大数据计算 MaxCompute 正文

MaxCompute这个任务报错的原因可以解释一下吗？分区数据量很大，这个需要调那个参呢？

FAILED: ODPS-0130071:[0,0] Semantic analysis exception - physical plan generation failed: java.lang.RuntimeException: com.aliyun.odps.lot.cbo.plan.splitting.disruptor.SplitTimeoutException: Split data source timeout. Task:M1, Table:._s [PartitionNum:1962] MaxCompute这个任务报错的原因可以解释一下吗？分区数据量很大，这个需要调那个参呢？http://logview.odps.aliyun.com/logview/?h=http://service.cn.maxcompute.aliyun-inc.com/api&p=bi_ngmm&i=20230505215540328g3c21ni9qcg&token=amQ1STJxdVBJeTRLSzlPeEpDM3JnVE0wMTJBPSxPRFBTX09CTzpwNF8yOTg1MjE3NzM1NjE3MTM5ODksMTY4NTkxNTc0MCx7IlN0YXRlbWVudCI6W3siQWN0aW9uIjpbIm9kcHM6UmVhZCJdLCJFZmZlY3QiOiJBbGxvdyIsIlJlc291cmNlIjpbImFjczpvZHBzOio6cHJvamVjdHMvYmlfbmdtbS9pbnN0YW5jZXMvMjAyMzA1MDUyMTU1NDAzMjhnM2MyMW5pOXFjZyJdfV0sIlZlcnNpb24iOiIxIn0=

展开

收起

冰激凌甜筒 2023-05-07 15:07:30 235 版权

版权声明：本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

1 条回答

写回答

取消提交回答

微笑向日葵

SQLTask is splitting data sources sql 作业优化中，切分data sources 【该阶段作业卡住的可能原因 1 】读取的分区太多。每个分区需要去根据分区信息来决定处理方式，决定 split，并且会写到生成的执行计划中。【解决方法】需要好好设计 SQL，减少分区的数量，包括：分区裁剪、筛除不需要读的分区、把大作业拆成小作业。如何判断 SQL 中分区剪裁是否生效，以及分区裁剪失效的常见场景请参考文章：分区裁剪合理性评估https://help.aliyun.com/document_detail/58679.html

【该阶段作业卡住的可能原因 2 】小文件太多。ODPS 会根据文件大小决定 split，小文件多了会导致计算 split 的过程耗时增加。【产生小文件的原因】：对分区表进行 insert into 操作的时候，会在 partition 目录下面生成一个新文件。【解决方法】：执行一次 alter table merge smallfiles; 让 odps 把小文件 merge 起来。更多内容请参考官方文档：合并小文件优化介绍：https://help.aliyun.com/document_detail/466838.html，此回答整理自钉群“MaxCompute开发者社区2群”

2023-05-07 15:09:58

赞同展开评论

问答分类：

分布式计算 MaxCompute 云原生大数据计算服务 MaxCompute

问答标签：

云原生大数据计算服务 MaxCompute任务云原生大数据计算服务 MaxCompute分区云原生大数据计算服务 MaxCompute报错云原生大数据计算服务 MaxCompute数据量云原生大数据计算服务 MaxCompute分区数据量

问答地址：

开发者社区 > 大数据与机器学习 > 大数据计算 MaxCompute > 问答

相关问答

MaxCompute数据量非常大情况下取数据使用哪种排序方式

64

0

0

大数据计算MaxCompute表是table2.0的数据量是144MB 这个是要往小的设置吗？

117

3

0

在大数据计算MaxCompute中，想了解一个项目空间，每天新增的数据量的大小，有简单的方法吗？

110

2

0

大数据计算MaxCompute每日作业扫描数据量，怎么计算出来的？

120

1

0

maxcompute查看单张表的数据量增长情况怎么操作？

91

0

0

大数据计算MaxCompute查询数据量大的时候报错怎么解决？

117

2

0

大数据计算MaxCompute按每天分区，一天多少条数据量建议做分区呢？

88

1

0

大数据计算MaxCompute这样的数据量算20GB，还是100GB？

94

1

0

大数据计算MaxCompute两个表mapjon后，这个数据量是怎么计费的？

87

1

0

大数据计算MaxCompute 除了通过分区筛选还有什么办法能减少读取的数据量？

86

1

0

大数据与机器学习

大数据计算 MaxCompute

MaxCompute（原ODPS）是一项面向分析的大数据计算服务，它以Serverless架构提供快速、全托管的在线数据仓库服务，消除传统数据平台在资源扩展性和弹性方面的限制，最小化用户运维投入，使您经济并高效的分析处理海量数据。

我要提问

相关文章

别把无人驾驶想太玄，大数据才是背后真正的老司机

Ray Forward 2025 定档 12 月 20 日北京！议题征集通道已开放

技术全景图：如何理解我们身边的技术类型？

技术的金字塔：我们如何对现代技术进行分类？

阿里云DLF 3.0：面向AI时代的智能全模态湖仓管理平台

热门讨论

热门文章

阿里云和腾讯云服务器哪个好！

MaxCompute这个正则一直报这个错，该怎么处理?

sparksql中cte物化方式是怎样的

ODPS 的下一个15年，大数据将迎来春天还是寒冬？

大数据计算MaxCompute的datawork做数据同步的时候，可以解决源系统表名不固定的情况嘛？

大数据计算MaxCompute阿里云一个CU对应多少cpu和内存？

请问大数据计算MaxCompute我如果想在ODPS里对二进制做位移操作，能实现吗？

dataworks中maxcompute里是否内置比较字符串相似度的函数？

请问MaxCompute和DataWorks有啥区别？

大数据计算MaxCompute的group by 时合并array , 用什么方法？

展开全部

大数据环境下该如何优雅地设计数据分层

odps是什么?

MaxCompute执行作业慢的原因排查

阿里云MaxCompute（大数据）公开数据集---带你玩转人工智能

优酷背后的大数据秘密

2017杭州云栖大会FAQ（持续更新中）

Python+大数据计算平台，PyODPS架构手把手教你搭建

【大数据干货】轻松处理每天2TB的日志数据，支撑运营团队进行大数据分析挖掘，随时洞察用户个性化需求。

【转载】时隔一年多，我又用起了 Superset

品《阿里巴巴大数据实践-大数据之路》一书（上）

展开全部

还有其他疑问?