备案控制台

开发者社区大数据与机器学习大数据计算 MaxCompute 正文

大数据计算MaxCompute是不是就是第二个周期写进来的数据呢?

"周期任务在比较短的时间内运行，大数据计算MaxCompute会出现第一个周期的某个任务在读a表，第二个周期的任务在写这个表的情况不?如果这种的话，第一个周期读的数据，是不是就是第二个周期写进来的数据呢?
"

展开

收起

真的很搞笑 2023-10-20 19:03:02 70 版权

版权声明：本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

2 条回答

写回答

取消提交回答

wljslmz

公众号：网络技术联盟站，InfoQ签约作者，阿里云社区签约作者，华为云云享专家，BOSS直聘创作王者，腾讯课堂创作领航员，博客+论坛：https://www.wljslmz.cn，工程师导航：https://www.wljslmz.com
问题1：是的，如果周期任务在比较短的时间内运行，MaxCompute可能会出现第一个周期的某个任务在读a表，第二个周期的任务在写这个表的情况。这种情况下，第一个周期读的数据就是第二个周期写进来的数据。

问题2：为了避免这种情况，可以考虑以下几种解决方案：
1. 使用事务来保证数据的一致性。在第一个周期的任务中，将需要读取的数据加上排他锁，确保其他任务无法修改这些数据。在第二个周期的任务中，将需要写入的数据加上共享锁，确保其他任务可以读取这些数据。这样可以保证数据的一致性和可靠性。
2. 使用增量更新的方式来减少数据写入的次数。在第一个周期的任务中，只将新增或修改的数据写入到表中。在第二个周期的任务中，再将这些增量数据合并到原始数据中。这样可以减少数据写入的次数，提高系统的性能和稳定性。
3. 调整调度周期的长度。如果调度周期比较短，可以考虑将其延长一些，以减少不同周期任务之间的冲突和竞争。同时，也可以根据业务需求和系统性能来选择合适的调度周期长度。
2023-10-22 21:00:57

赞同展开评论
芯在这

可以看到部分数据。只能尽量先跑完写的任务。资源倾向到这个任务上面，此回答整理自钉群“MaxCompute开发者社区2群”

2023-10-20 19:48:12

赞同展开评论

问答分类：

调度分布式计算 MaxCompute 大数据云原生大数据计算服务 MaxCompute

问答标签：

云原生大数据计算服务 MaxCompute MaxCompute 云原生大数据计算服务 MaxCompute数据大数据计算云原生大数据计算服务 MaxCompute 大数据云原生大数据计算服务 MaxCompute数据大数据计算云原生大数据计算服务 MaxCompute数据

问答地址：

开发者社区 > 大数据与机器学习 > 大数据计算 MaxCompute > 问答

相关问答

大数据计算MaxCompute备份周期超过1天的是不是要收费？

79

2

0

大数据计算MaxCompute这样配置生产为什么没有周期实例产生？

67

0

0

Hologres通过DataWorks周期性导入MaxCompute数据

76

1

0

大数据计算MaxCompute这个备份机制免费周期是啥意思，我要是设置成备份机制5天，是要收费吗？

90

1

0

大数据计算MaxCompute中，按小时调度的周期任务，选择发布立即生成，发布当天会有问题，能解决？

98

1

0

大数据计算MaxCompute开发环境能否设置首次全量周期性增量的数据同步任务呢？

97

0

0

大数据计算MaxCompute一个周期任务的同步日志，入口在哪里？

54

1

0

我问下大数据计算MaxCompute要是dataworks中配置的周期任务是属于这个样子的吗？

69

1

0

在大数据计算MaxCompute申请一个新项目空间分层存储功能审批周期大概是多久？

96

1

0

大数据计算MaxCompute odps客户端建立外部表成功了，但是插入数据报错？

165

1

0

大数据与机器学习

大数据计算 MaxCompute

MaxCompute（原ODPS）是一项面向分析的大数据计算服务，它以Serverless架构提供快速、全托管的在线数据仓库服务，消除传统数据平台在资源扩展性和弹性方面的限制，最小化用户运维投入，使您经济并高效的分析处理海量数据。

我要提问

相关文章

Python生成器 vs 迭代器：从内存到代码的深度解析

Dataphin x Paimon 开箱即用的数据湖治理解决方案

《AI工具驱动的分布式任务调度系统从0到1实践解析》

AI在智慧能源管理中的边缘计算应用

当AI遇上智慧能源：边缘计算才是“节能王炸组合”

热门讨论

热门文章

ODPS 的下一个15年，大数据将迎来春天还是寒冬？

大数据计算MaxCompute本地数据导入出现乱码，怎么解决?

大数据计算MaxCompute的datawork做数据同步的时候，可以解决源系统表名不固定的情况嘛？

阿里云和腾讯云服务器哪个好！

大数据计算MaxCompute看后续的日志文件中提示请求头异常？

大数据计算MaxCompute同步任务添加新字段报错了，咋解决？

DataWorks中maxcompute怎么生成日期列表？

在大数据计算MaxCompute中使用pyODPS读取文件，再写入 ODPS，需要指定列名吗？

LabelSecurity 安全等级是什么？

你好，大数据计算MaxCompute在运行pyodpsDataFrame的persist函数时报这?

展开全部

odps是什么?

阿里云MaxCompute（大数据）公开数据集---带你玩转人工智能

吴刚专访--大数据和 MaxCompute 技术和故事

2017杭州云栖大会FAQ（持续更新中）

【大数据干货】轻松处理每天2TB的日志数据，支撑运营团队进行大数据分析挖掘，随时洞察用户个性化需求。

【转载】时隔一年多，我又用起了 Superset

干货：解码OneData，阿里的数仓之路。

使用 MaxCompute Studio 开发大数据应用

［ETL实践指南］基于Kettle的MaxCompute插件实现数据上云

阿里数据仓库实践分享

展开全部

还有其他疑问?