备案控制台

开发者社区大数据与机器学习大数据计算 MaxCompute 正文

MaxCompute这个任务报错的原因可以解释一下吗？分区数据量很大，这个需要调那个参呢？

FAILED: ODPS-0130071:[0,0] Semantic analysis exception - physical plan generation failed: java.lang.RuntimeException: com.aliyun.odps.lot.cbo.plan.splitting.disruptor.SplitTimeoutException: Split data source timeout. Task:M1, Table:._s [PartitionNum:1962] MaxCompute这个任务报错的原因可以解释一下吗？分区数据量很大，这个需要调那个参呢？http://logview.odps.aliyun.com/logview/?h=http://service.cn.maxcompute.aliyun-inc.com/api&p=bi_ngmm&i=20230505215540328g3c21ni9qcg&token=amQ1STJxdVBJeTRLSzlPeEpDM3JnVE0wMTJBPSxPRFBTX09CTzpwNF8yOTg1MjE3NzM1NjE3MTM5ODksMTY4NTkxNTc0MCx7IlN0YXRlbWVudCI6W3siQWN0aW9uIjpbIm9kcHM6UmVhZCJdLCJFZmZlY3QiOiJBbGxvdyIsIlJlc291cmNlIjpbImFjczpvZHBzOio6cHJvamVjdHMvYmlfbmdtbS9pbnN0YW5jZXMvMjAyMzA1MDUyMTU1NDAzMjhnM2MyMW5pOXFjZyJdfV0sIlZlcnNpb24iOiIxIn0=

展开

收起

冰激凌甜筒 2023-05-07 15:07:30 244 版权

版权声明：本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

1 条回答

写回答

取消提交回答

微笑向日葵

SQLTask is splitting data sources sql 作业优化中，切分data sources 【该阶段作业卡住的可能原因 1 】读取的分区太多。每个分区需要去根据分区信息来决定处理方式，决定 split，并且会写到生成的执行计划中。【解决方法】需要好好设计 SQL，减少分区的数量，包括：分区裁剪、筛除不需要读的分区、把大作业拆成小作业。如何判断 SQL 中分区剪裁是否生效，以及分区裁剪失效的常见场景请参考文章：分区裁剪合理性评估https://help.aliyun.com/document_detail/58679.html

【该阶段作业卡住的可能原因 2 】小文件太多。ODPS 会根据文件大小决定 split，小文件多了会导致计算 split 的过程耗时增加。【产生小文件的原因】：对分区表进行 insert into 操作的时候，会在 partition 目录下面生成一个新文件。【解决方法】：执行一次 alter table merge smallfiles; 让 odps 把小文件 merge 起来。更多内容请参考官方文档：合并小文件优化介绍：https://help.aliyun.com/document_detail/466838.html，此回答整理自钉群“MaxCompute开发者社区2群”

2023-05-07 15:09:58

赞同展开评论

问答分类：

分布式计算 MaxCompute 云原生大数据计算服务 MaxCompute

问答标签：

云原生大数据计算服务 MaxCompute任务云原生大数据计算服务 MaxCompute分区云原生大数据计算服务 MaxCompute报错云原生大数据计算服务 MaxCompute数据量云原生大数据计算服务 MaxCompute分区数据量

问答地址：

开发者社区 > 大数据与机器学习 > 大数据计算 MaxCompute > 问答

相关问答

MaxCompute数据量非常大情况下取数据使用哪种排序方式

64

0

0

大数据计算MaxCompute删除了某个分区的数据，有办法找回嘛？

317

5

0

大数据计算MaxCompute表是table2.0的数据量是144MB 这个是要往小的设置吗？

118

3

0

在大数据计算MaxCompute中，想了解一个项目空间，每天新增的数据量的大小，有简单的方法吗？

111

2

0

大数据计算MaxCompute每日作业扫描数据量，怎么计算出来的？

120

1

0

maxcompute查看单张表的数据量增长情况怎么操作？

96

0

0

大数据计算MaxCompute查询数据量大的时候报错怎么解决？

128

2

0

大数据计算MaxCompute按每天分区，一天多少条数据量建议做分区呢？

89

1

0

大数据计算MaxCompute这样的数据量算20GB，还是100GB？

94

1

0

大数据计算MaxCompute两个表mapjon后，这个数据量是怎么计费的？

87

1

0

大数据与机器学习

大数据计算 MaxCompute

MaxCompute（原ODPS）是一项面向分析的大数据计算服务，它以Serverless架构提供快速、全托管的在线数据仓库服务，消除传统数据平台在资源扩展性和弹性方面的限制，最小化用户运维投入，使您经济并高效的分析处理海量数据。

我要提问

相关文章

阿里云渠道商：如何快速使用阿里云ECS？

DMS Airflow：企业级数据工作流编排平台的专业实践

阿里云大数据AI产品月刊-2025年10月

一、Scala 基础语法、变量与数据类型

告别繁琐循环：用Java Stream优雅处理集合

热门讨论

热门文章

MaxCompute这个正则一直报这个错，该怎么处理?

sparksql中cte物化方式是怎样的

大数据计算maxcompute支持递归查询吗？

大数据计算MaxCompute阿里云一个CU对应多少cpu和内存？

阿里云和腾讯云服务器哪个好！

dataworks中maxcompute里是否内置比较字符串相似度的函数？

请问MaxCompute和DataWorks有啥区别？

sparksql读取maxcompute表，出现datetime out of range

在大数据计算MaxCompute中，请问这个报错如何解决？

ODPS 的下一个15年，大数据将迎来春天还是寒冬？

展开全部

分布式存储系统

MaxCompute（原ODPS）开发入门指南——数据开发工具篇

手把手，教你用MaxCompute+OpenSearch搭建分布式搜索引擎

MaxCompute Tunnel SDK数据上传利器——BufferedWriter使用指南

云上游戏数据分析实践

MaxCompute 最新特性介绍2019年8月版

一条SQL在 MaxCompute 分布式系统中的旅程

odps是什么?

【转载文章】记录一次MySQL两千万数据的大表优化解决过程，提供三种解决方案

解密淘宝推荐实战，打造 “比你还懂你” 的个性化APP

展开全部

还有其他疑问?