备案控制台

开发者社区大数据与机器学习大数据计算 MaxCompute 正文

大数据计算MaxCompute透露一下，增量数据和历史合并运行时长会从原来可能是小时级别的到现在?

大数据计算MaxCompute透露一下，增量数据和历史合并运行时长会从原来可能是小时级别的到现在的多少？分钟级别还是？

展开

收起

真的很搞笑 2023-08-13 11:02:23 117 版权

版权声明：本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

2 条回答

写回答

取消提交回答

算精通

北京阿里云ACE会长

在大数据计算MaxCompute中，增量数据和历史数据的合并运行时长可以根据具体情况而有所不同。以下是一些常见的情况和对应的运行时长：

少量增量数据：如果增量数据量比较小，通常在分钟级别内就可以完成合并运算。这是因为增量数据量小，计算引擎可以快速处理并合并到历史数据中。

大量增量数据：当增量数据量较大时，合并运行时长可能需要更长的时间。具体的运行时长取决于增量数据的大小、计算引擎的计算能力、集群负载情况等因素。对于大量增量数据，合并运行时长可能会延长到小时级别。

需要注意的是，MaxCompute的计算能力和性能受到多个因素的影响，如集群规模、资源配置、数据规模、计算逻辑复杂度等。因此，无法提供具体的时长范围，而是需要根据实际情况进行评估和测试。

如果您关注合并运行时长的性能问题，可以考虑以下优化策略：

针对增量数据进行分区：将增量数据按照某个关键字段进行分区，可以降低合并运行时长，只对相关的分区数据进行合并处理。

调整集群资源配置：根据实际需求，适当增加集群的计算资源配置，以提高计算能力和并发处理能力。

优化计算逻辑：评估和优化合并过程中的计算逻辑，减少不必要的计算和数据迁移操作，提高运行效率。

并行处理：如果数据允许并行处理，可以考虑将合并操作划分为多个子任务，并行处理各个子任务，从而减少总体的运行时长。

2023-08-13 22:28:44

赞同展开评论
芯在这

我们是t+1合并，不是实时。实时单链路用flink成本太贵了，此回答整理自钉群“MaxCompute开发者社区2群”

2023-08-13 11:35:06

赞同展开评论

问答分类：

分布式计算大数据 MaxCompute 云原生大数据计算服务 MaxCompute

问答标签：

云原生大数据计算服务 MaxCompute数据云原生大数据计算服务 MaxCompute MaxCompute 大数据计算云原生大数据计算服务 MaxCompute 大数据云原生大数据计算服务 MaxCompute数据大数据计算云原生大数据计算服务 MaxCompute数据

问答地址：

开发者社区 > 大数据与机器学习 > 大数据计算 MaxCompute > 问答

相关问答

大数据计算MaxCompute中online job 失败重跑还是出现，脚本运行时长变长还是没有解决

197

4

0

请问大数据计算MaxCompute中有没有类似mysql中这样的设置事务级别的变量的方法？

150

3

0

帮看看大数据计算MaxCompute这是为啥？

79

1

0

大数据计算MaxCompute允许全表扫描，不加分区，怎么设置set语句呢？

192

2

0

请问大数据计算MaxCompute这个报错是什么问题？

178

2

0

大数据计算MaxCompute 看下这个什么原因，是opds没有权限吗？

208

2

0

大数据计算MaxCompute这个报错是啥意思？

256

2

0

在大数据计算MaxCompute中，提示参数不支持，还是白天手动补数据才可以怎么回事？

150

2

0

在大数据计算MaxCompute中，这个地方有的时候执行任务，就会卡住动不了怎么办？

179

3

0

在大数据计算MaxCompute中，ftp文件到另一台机器这个有操作说明或者文档可以查吗

148

5

0

大数据与机器学习

大数据计算 MaxCompute

MaxCompute（原ODPS）是一项面向分析的大数据计算服务，它以Serverless架构提供快速、全托管的在线数据仓库服务，消除传统数据平台在资源扩展性和弹性方面的限制，最小化用户运维投入，使您经济并高效的分析处理海量数据。

我要提问

相关文章

手把手教你搞定大数据上云：数据迁移的全流程解析

到底该选谁？Hadoop、Spark、Flink、云大数据的“江湖全景图”

Redis中的scan命令使用解析:

Linux网络带宽优化配置（小白也能看懂的实战指南）

数据建模到底怎么稳？从维度建模聊到列式存储，让你的数据仓库飞起来！

热门讨论

热门文章

ODPS 的下一个15年，大数据将迎来春天还是寒冬？

阿里云和腾讯云服务器哪个好！

请问大数据计算MaxCompute我如果想在ODPS里对二进制做位移操作，能实现吗？

在大数据计算MaxCompute中，这要怎么修改字段类型？

sparksql中cte物化方式是怎样的

请教个大数据计算MaxCompute问题，报这个错误是啥情况？

MaxCompute中执行SQL报错ODPS-0130071

大数据计算MaxCompute的group by 时合并array , 用什么方法？

dataworks中maxcompute里是否内置比较字符串相似度的函数？

阿里云一个CU对应多少cpu和内存?

展开全部

大数据环境下该如何优雅地设计数据分层

odps是什么?

MaxCompute执行作业慢的原因排查

阿里云MaxCompute（大数据）公开数据集---带你玩转人工智能

优酷背后的大数据秘密

吴刚专访--大数据和 MaxCompute 技术和故事

2017杭州云栖大会FAQ（持续更新中）

Python+大数据计算平台，PyODPS架构手把手教你搭建

【大数据干货】轻松处理每天2TB的日志数据，支撑运营团队进行大数据分析挖掘，随时洞察用户个性化需求。

【转载】时隔一年多，我又用起了 Superset

展开全部

还有其他疑问?