文档备案控制台

开发者社区大数据与机器学习大数据计算 MaxCompute 正文

大数据计算MaxCompute可以优化的部分是不是就只有打包这块了？有什么可以优化的方案？

大数据计算MaxCompute可以优化的部分是不是就只有打包这块了？有什么可以优化的方案？现在是每次运行，打包，上传，运行，看log。这块比较麻烦。

展开

收起

真的很搞笑 2024-03-04 10:49:31 235 版权

版权声明：本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

2 条回答

写回答

取消提交回答

小周sir

面对过去，不要迷离；面对未来，不必彷徨；活在今天，你只要把自己完全展示给别人看。
大数据计算MaxCompute的优化不仅仅局限于打包这一块，还包括以下几个方面：
1. 数据倾斜优化：当某些分区的数据量远大于其他分区时，会导致任务运行缓慢。可以通过调整分区键或者使用分桶技术来解决这个问题。
2. SQL查询优化：针对复杂的SQL查询，可以对查询进行优化，例如使用索引、减少JOIN操作、使用子查询等。
3. 数据预处理：在数据进入MaxCompute之前，可以对数据进行预处理，例如去除无用字段、过滤异常数据等，以减少计算量。
4. 资源调度优化：合理分配MaxCompute的资源，例如调整作业并发数、设置优先级等，以提高作业运行效率。
5. 使用UDF（用户自定义函数）：针对特定业务场景，可以使用UDF来提高计算效率。
针对你提到的每次运行、打包、上传、运行、看log的过程，可以尝试以下优化方案：
1. 自动化脚本：编写自动化脚本，将打包、上传、运行等操作整合在一起，减少人工操作。
2. 监控告警：设置监控告警，当作业出现异常时，可以及时收到通知，避免重复查看log。
3. 使用DataWorks等大数据开发平台：这些平台可以帮助你更方便地管理MaxCompute作业，例如可视化界面、作业调度等功能。
2024-03-04 15:46:11

赞同 1 展开评论
芯在这

idea local模式试下：https://help.aliyun.com/zh/maxcompute/user-guide/running-modes?spm=a2c4g.11186623.0.0.320a5265KHKJWM#section-1tq-j9h-c6m ，此回答整理自钉群“MaxCompute开发者社区2群”

2024-03-04 11:05:32

赞同展开评论

问答分类：

分布式计算 MaxCompute 大数据云原生大数据计算服务 MaxCompute

问答标签：

云原生大数据计算服务 MaxCompute优化云原生大数据计算服务 MaxCompute MaxCompute 大数据计算云原生大数据计算服务 MaxCompute 云原生大数据计算服务 MaxCompute方案云原生大数据计算服务 MaxCompute打包

问答地址：

开发者社区 > 大数据与机器学习 > 大数据计算 MaxCompute > 问答

相关问答

大数据计算MaxCompute中CONV 函数转化不了可以帮忙看下有没有其他方案解决？

182

1

0

在大数据计算MaxCompute中只想要雪花id 有其他方案吗？

202

0

0

大数据计算MaxCompute这两种方案，使用订单进行关联时，在运行效率上，哪种会更优呢？

167

1

0

大数据计算MaxCompute的数据集成这块报错是什么原因？

229

1

0

大数据计算MaxCompute这块目前有方案能支持吗？

166

1

0

大数据计算MaxCompute有没有可以按MAC项目一键全部迁移的方案呢？

562

1

0

maxcompute 和odps的关系是什么啊，我第一次做这个，有点不懂

2999

1

0

大数据中maxcompute跟emr的区别是什么呢？

1059

1

0

云原生大数据计算服务 MaxCompute里，运维中最重要的模块是谁？

1094

1

0

云原生大数据计算服务 MaxCompute中，DataWorks开发流程是怎样的？

1220

1

0

大数据与机器学习

大数据计算 MaxCompute

MaxCompute（原ODPS）是一项面向分析的大数据计算服务，它以Serverless架构提供快速、全托管的在线数据仓库服务，消除传统数据平台在资源扩展性和弹性方面的限制，最小化用户运维投入，使您经济并高效的分析处理海量数据。

我要提问

相关文章

Hologres + Flink 实时OLAP分析实战：从T+1报表到秒级洞察的数据平台

Data Agent 落地的下半场：让企业学会与 AI 协作

为什么物流公司都在卷“算法”？大数据如何让配送路线越跑越聪明

EMR Serverless Spark PB级文本语义去重4倍加速的技术方案解读

相关解决方案

更多

文件下载加速及成本优化

基于 Spark 和 PyTorch 的模型训练方案

RDS 到 Redis 实时同步方案

网站静态资源加速与安全优化

RocketMQ for AI：企业级 AI 应用集成的异步通信方案

热门讨论

热门文章

ODPS 的下一个15年，大数据将迎来春天还是寒冬？

大数据计算MaxCompute该字段类型从tinyint改为Int,怎么修改?

MaxCompute这个yaml资源在生产环境中无法找到,什么原因？

大数据计算MaxCompute这种mapjoin构建hash table时间很长，有什么优化方向吗?

关于MaxCompute 中的CU为什么设置CPU和内存的比例是1:4

在大数据计算MaxCompute中，有没有for循环类似的函数？

问一下我现在使用大数据计算MaxCompute，容量不足，申请了存储空间，发给我一个tenanid?

大数据计算MaxCompute存储按量付费 100T一天要400元有没有包月的?

删除，和变动的数据，hive分区要怎么处理呢？

大数据计算MaxCompute datawork中和group_concat函数作用相同的函数？

展开全部

大数据环境下该如何优雅地设计数据分层

odps是什么?

MaxCompute执行作业慢的原因排查

优酷背后的大数据秘密

吴刚专访--大数据和 MaxCompute 技术和故事

2017杭州云栖大会FAQ（持续更新中）

【转载】时隔一年多，我又用起了 Superset

干货：解码OneData，阿里的数仓之路。

[大数据新手上路]“零基础”系列课程--如何将ECS上的Hadoop数据迁移到阿里云数加·MaxCompute

阿里云MaxCompute 2019-5月刊

展开全部

还有其他疑问?