文档备案控制台

开发者社区大数据与机器学习大数据计算 MaxCompute 正文

大数据计算MaxCompute一个几百万的表和一个几千的表，有什么方法优化吗？

大数据计算MaxCompute一个几百万的表和一个几千的表，做笛卡尔积(业务逻辑上需要) join 有什么方法优化吗？

展开

收起

夹心789 2024-05-19 18:13:14 175 版权

版权声明：本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

1 条回答

写回答

取消提交回答

芯在这

看下mapjoin：https://help.aliyun.com/zh/maxcompute/user-guide/mapjoin-hints?spm=a2c4g.11186623.0.i57#section-cmz-kbp-e9u

你把online关了再重跑一下Fuxi Job的两种作业类型：Online Job（service mode）和Offline Job。对于Offline的作业而言，当每次提交作业时在Fuxi上都会有一个环境准备的时间，针对大数据量并且不需要返回查询结果的作业比较合适，而对小数据量并且实时作业要求比较高的作业是不合适的。所以Fuxi提供为什么ServiceMode这种准实时的作业形式，也是online，首先会有一个服务去预先申请计算一些资源并加载出来，比如会预先分配一万个nstance，当有作业提交时会根据作业规模分配一些Instance进行执行，这样就省去环境准备的时间，所以就会比较快。online不等资源且不保证成功。如果service mode失败，比如instance个数超过1000，或者运行超过10分钟，就会退回以Offline模式重跑。可以set odps.service.mode=off;这样就直接跑完了，不会再跑online ，此回答整理自钉群“MaxCompute开发者社区2群”

2024-05-20 09:32:54

赞同 1 展开评论

问答分类：

分布式计算 MaxCompute 大数据云原生大数据计算服务 MaxCompute

问答标签：

云原生大数据计算服务 MaxCompute优化云原生大数据计算服务 MaxCompute MaxCompute 大数据计算云原生大数据计算服务 MaxCompute 云原生大数据计算服务 MaxCompute方法大数据计算云原生大数据计算服务 MaxCompute方法

问答地址：

开发者社区 > 大数据与机器学习 > 大数据计算 MaxCompute > 问答

相关问答

大数据计算MaxCompute这种mapjoin构建hash table时间很长，有什么优化方向吗?

1615

1

0

大数据计算MaxCompute现在没有按量买cpu了吗？我目前优化的还是按量消费闲时版

178

1

0

这种子查询，在主查询中使用多次，在maxcompute里面有优化的方法吗？

171

1

0

RDMA技术的主要优势是什么？它如何帮助大数据分布式计算优化？

454

1

0

MaxCompute这个语句该怎么优化呀？

180

1

0

大数据计算MaxCompute包年包月规格开通MCQA 这个哪里可以看包年包月多少钱？

181

1

0

请问大数据计算MaxCompute odps 引擎中，with as语句走的是内存吗?

334

1

0

大数据计算MaxCompute的查询优化里面对concat拼接起来的分区字段会走优化嘛？

308

3

0

有大数据计算MaxCompute作业效率优化的规范文档吗？

193

2

0

大数据计算MaxCompute dataworks离线数据集成，是这样的关系么？

279

4

0

大数据与机器学习

大数据计算 MaxCompute

MaxCompute（原ODPS）是一项面向分析的大数据计算服务，它以Serverless架构提供快速、全托管的在线数据仓库服务，消除传统数据平台在资源扩展性和弹性方面的限制，最小化用户运维投入，使您经济并高效的分析处理海量数据。

我要提问

相关文章

2026六款Vibe Coding工具入门实测：企业PySpark大数据代码质量管控教程

六款Vibe Coding工具横向对比：PySpark大数据缺陷识别与迭代落地指南

从品牌指标到诊断报告：结果解释与边界声明的数据工程实践

AI+本地生活时代，2026年同城外卖系统源码开发有哪些新变化？

悟空云电脑完整入门手册：产品介绍、全功能、多场景应用、购买流程及 FAQ 答疑

热门讨论

热门文章

ODPS 的下一个15年，大数据将迎来春天还是寒冬？

大数据计算MaxCompute该字段类型从tinyint改为Int,怎么修改?

请问下大数据计算MaxCompute dataworks是否有全局变量？

关于MaxCompute 中的CU为什么设置CPU和内存的比例是1:4

大数据计算MaxCompute这种mapjoin构建hash table时间很长，有什么优化方向吗?

大数据计算MaxCompute用kettle的转换功能去进行odps的同步数据可行吗？

MaxCompute中下面图片是什么意思？

今天用实时同步同步了 RDS 数据到 MaxCompute，任务运维上显示成功，看日志也没有问

大数据计算MaxCompute作业运维排序报错，如何解决？

在大数据计算MaxCompute中，这种多久能查询到？

展开全部

odps是什么?

MaxCompute执行作业慢的原因排查

吴刚专访--大数据和 MaxCompute 技术和故事

[大数据新手上路]“零基础”系列课程--如何将ECS上的Hadoop数据迁移到阿里云数加·MaxCompute

干货：解码OneData，阿里的数仓之路。

品《阿里巴巴大数据实践-大数据之路》一书（上）

MaxCompute常见错误汇总（更新ing）

【内含分享PPT/视频/文章】阿里云MVP学院MaxCompute技术闭门会线上首播 | 2019大数据技术公开课第二季

如何有效降低大数据平台安全风险

企业大数据平台下数仓建设思路

展开全部

还有其他疑问?