文档备案控制台

开发者社区大数据与机器学习大数据计算 MaxCompute 正文

大数据计算MaxCompute看起来好像又不是，单个都是1分钟多,他们不是完全并行的？

大数据计算MaxCompute看起来好像又不是，单个都是1分钟多,他们不是完全并行的？

展开

收起

真的很搞笑 2023-12-03 19:27:33 154 版权

版权声明：本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

2 条回答

写回答

取消提交回答

sunrr

在MaxCompute中，如果一个任务被分成了多个子任务（也称为Instance），那么这些子任务是并行执行的。也就是说，它们会同时开始读取数据，同时进行计算，最后同时完成。

然而，这并不意味着它们的执行速度是一样的。因为每个子任务处理的数据量可能不同，或者每个子任务的计算复杂度可能不同，所以它们的执行时间可能会有所不同。

2023-12-04 16:52:02

赞同展开评论
小周sir

面对过去，不要迷离；面对未来，不必彷徨；活在今天，你只要把自己完全展示给别人看。

在MaxCompute中，任务（Task）是其基本计算单元，所有的SQL和MapReduce功能都是通过任务来完成的。每个任务在被提交后，MaxCompute会对其进行解析以生成任务的执行计划。

尽管MaxCompute的设计初衷是为了实现并行处理以提高运算效率，但在实际运行中，由于存在任务间的依赖关系，因此并不是所有任务都能完全并行执行。一个任务的开始运行可能需要等待其依赖的任务先运行完成。这种任务间的依赖性可能会影响到整体的执行效率，使得单个任务的执行时间增加。

此外，根据实际生产项目的经验，即使是计算量较大的任务，其执行时间（包括等待时间和真正运行时间）通常也不会超过1个小时。对于使用spark等类型的作业，如果一个job启动时间较长，也是正常现象。

总的来说，虽然MaxCompute设计上支持并行处理，但由于任务间的依赖关系和特定任务类型的特性，可能会导致单个任务的执行时间超过预期。同时，也需要注意监控和管理任务的状态，以确保任务能够顺利执行并及时获取任务的执行进度。

2023-12-03 21:14:15

赞同展开评论

问答分类：

分布式计算 MaxCompute 大数据云原生大数据计算服务 MaxCompute

问答标签：

云原生大数据计算服务 MaxCompute MaxCompute 大数据计算云原生大数据计算服务 MaxCompute 云原生大数据计算服务 MaxCompute并行云原生大数据计算服务 MaxCompute大数据计算大数据计算云原生大数据计算服务 MaxCompute并行

问答地址：

开发者社区 > 大数据与机器学习 > 大数据计算 MaxCompute > 问答

相关问答

请问大数据计算MaxCompute产品文档里面使用多进程并行写数据的demo也会出现这个问题?

157

2

0

在大数据计算MaxCompute中，我现在想开启修改列名的，但是报了没有权限，这个要加什么权限

286

3

0

在大数据计算MaxCompute中，自建的mysql的，是不是不支持外部表？

239

3

0

MaxCompute支持并行计算以加速数据处理任务。要优化并行度，如何调整参数？

138

0

0

大数据计算MaxCompute的finereport配置JDBC连接，并行执行的数量有限制吗？

183

1

0

大数据计算MaxCompute连接ODPS，最大sql数量运行，并行sql处理有限制吗？

191

1

0

大数据计算MaxCompute Java调用dataworks支持并行吗？

178

1

0

大数据计算MaxCompute这个看起来不行啊，不允许使用copytask开通数据跨境复制呢？

142

1

0

我要迁移到的目标是一个私有大数据计算MaxCompute，看起来无法解析host这个应该怎么解决呢？

213

0

0

大数据计算MaxCompute这个参数这里设置的一次同时处理的数据行数，是并行执行还是串行执行的？

233

1

0

大数据与机器学习

大数据计算 MaxCompute

MaxCompute（原ODPS）是一项面向分析的大数据计算服务，它以Serverless架构提供快速、全托管的在线数据仓库服务，消除传统数据平台在资源扩展性和弹性方面的限制，最小化用户运维投入，使您经济并高效的分析处理海量数据。

我要提问

相关文章

阿里云 CPFS 和对象存储OSS 有什么差异?

Hudi 湖仓一体架构：阿里云 AnalyticDB MySQL 原生集成最佳实践

基于SpringCloud+UniApp的智慧工地云平台整体架构设计与实现

推荐系统中的主要陷阱

Java网络编程（七）：NIO实战构建高性能Socket服务器

热门讨论

热门文章

ODPS 的下一个15年，大数据将迎来春天还是寒冬？

大数据计算MaxCompute用kettle的转换功能去进行odps的同步数据可行吗？

请问下大数据计算MaxCompute dataworks是否有全局变量？

大数据计算MaxCompute这种mapjoin构建hash table时间很长，有什么优化方向吗?

大数据计算MaxCompute该字段类型从tinyint改为Int,怎么修改?

今天用实时同步同步了 RDS 数据到 MaxCompute，任务运维上显示成功，看日志也没有问

datetime 类型是大数据计算MaxCompute特有的吗？

关于优化AI交互策略的改进建议——基于用户分层实现工具价值与体验平衡

请问大数据计算MaxCompute中我可以根据条件去判断是否执行一个sql吗?

关于MaxCompute 中的CU为什么设置CPU和内存的比例是1:4

展开全部

odps是什么?

MaxCompute执行作业慢的原因排查

阿里云MaxCompute（大数据）公开数据集---带你玩转人工智能

吴刚专访--大数据和 MaxCompute 技术和故事

优酷背后的大数据秘密

2017杭州云栖大会FAQ（持续更新中）

Python+大数据计算平台，PyODPS架构手把手教你搭建

【转载】时隔一年多，我又用起了 Superset

[大数据新手上路]“零基础”系列课程--如何将ECS上的Hadoop数据迁移到阿里云数加·MaxCompute

品《阿里巴巴大数据实践-大数据之路》一书（上）

展开全部

还有其他疑问?