备案控制台

开发者社区大数据与机器学习大数据计算 MaxCompute 正文

我这边想要实现的大数据计算MaxCompute 该怎么实现呢？

我这边想要实现的大数据计算MaxCompute是：把同一个表的数据从前面一个分区复制给新分区，然后在新分区的数据里根据binlog 用逻辑进行删除更新和插入，该怎么实现呢？

又因为克隆只能同名分区克隆，所以我在中间又加了个临时表，
即：A表的前一个分区 ---> 克隆给临时表B -----> 将临时表B的分区改为新分区 -----> 再将临时表B的数据克隆给A ----> 再在A表的新分区上进行数据增删改

A表必须为事务表 (因为要进行增删改)，是Transaction Table1.0 还是 2.0 我这边没要求，可以按可行性选择
B表是否是事务表都可以，这种模式也是无奈之举，因为我们的数据量近十亿，而且每个分区里必须保存全量否则业务实现不了，但是每天变化的数据只有几百万，现有逻辑是在前一个分区的基础上做merge，然后这个merge节点每天运行时间在15分钟+
我们就想着先克隆再增删改会快很多

展开

收起

真的很搞笑 2024-03-12 18:44:35 71 版权

版权声明：本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

1 条回答

写回答

取消提交回答

芯在这

是不是可以用一下，我之前给你说的。dw整库实时进mc，监控的binlog日志。，此回答整理自钉群“MaxCompute开发者社区1群”

2024-03-12 23:35:00

赞同展开评论

问答分类：

分布式计算 MaxCompute 大数据云原生大数据计算服务 MaxCompute

问答标签：

云原生大数据计算服务 MaxCompute MaxCompute 大数据计算云原生大数据计算服务 MaxCompute 云原生大数据计算服务 MaxCompute大数据计算大数据计算云原生大数据计算服务 MaxCompute怎么实现

问答地址：

开发者社区 > 大数据与机器学习 > 大数据计算 MaxCompute > 问答

相关问答

大数据计算MaxCompute odps py sdk，我执行SQL的时候她是跑在哪个资源组的呢？

165

3

0

大数据计算MaxCompute存储每小时都有一个几十G的量是按存储收费还是？

131

3

0

大数据计算MaxCompute odps客户端建立外部表成功了，但是插入数据报错？

197

1

0

大数据计算MaxCompute看日志好像是因为这个原因，但是文档上不是写的如果超了会退回离线查询吗？

91

0

0

在大数据计算MaxCompute中，麻烦添加下MaxCompute Notebook使用权限吧！

123

3

0

在大数据计算MaxCompute中，这是""空，就是不包含的意思么？如果包含要咋写

175

2

0

请问大数据计算MaxCompute，这个报错一般怎么导致的呢？可以怎么解决?

137

3

0

大数据计算MaxCompute按这个文档报错可以帮忙看下原因吗？

110

2

0

请问下，大数据计算MaxCompute的timestamp类型具体解释，有精度范围到2038年吗？

181

3

0

大数据计算MaxCompute貌似不需要设置角色权限所有开发角色都能读取package的数据是吗？

99

2

0

大数据与机器学习

大数据计算 MaxCompute

MaxCompute（原ODPS）是一项面向分析的大数据计算服务，它以Serverless架构提供快速、全托管的在线数据仓库服务，消除传统数据平台在资源扩展性和弹性方面的限制，最小化用户运维投入，使您经济并高效的分析处理海量数据。

我要提问

相关文章

周卫林｜大数据通往大模型的钥匙：NoETL to Trusted AI

脏数据不脏心：大数据平台的数据质量（DQ）入门实战与自动修复心法

Python列表推导式实战：1-100偶数生成全解析

从 Pandas 转向 Polars：新手常见的10 个问题与优化建议

分布式存储三国杀：对象存储 vs HDFS vs 列式存储，到底该怎么选？

热门讨论

热门文章

ODPS 的下一个15年，大数据将迎来春天还是寒冬？

按量付费咋MaxCompute文档里看不到全球各地价格差异呢？

阿里云一个CU对应多少cpu和内存?

请教个大数据计算MaxCompute问题，报这个错误是啥情况？

大数据计算MaxCompute的datawork做数据同步的时候，可以解决源系统表名不固定的情况嘛？

阿里云和腾讯云服务器哪个好！

MaxCompute中执行SQL报错ODPS-0130071

DataWorks中DBeaver查询MaxCompute，默认是UTC时区，这个要怎么修改呢？

sparksql中cte物化方式是怎样的

在MAXCOMPUTE里面，有没有快捷键可以直接把英文大写转变成小写？

展开全部

阿里云MaxCompute（大数据）公开数据集---带你玩转人工智能

干货：解码OneData，阿里的数仓之路。

[大数据新手上路]“零基础”系列课程--如何将ECS上的Hadoop数据迁移到阿里云数加·MaxCompute

大数据阿里云产品的简单介绍理解

混合云模式下 MaxCompute + Hadoop 混搭大数据架构实践

【逐云】阿里“水电煤”背后的人物故事

比自建 Hadoop 还便宜！云栖大会揭秘阿里云数加 MaxCompute

美柚与MaxCompute数据同步架构说明

在PyODPS DataFrame自定义函数中使用pandas、scipy和scikit-learn

iphoneX都面世了，你的数据仓库还停留在诺基亚时代吗?

展开全部

还有其他疑问?