DataWorks读取的是MySQL中的数据还是读取的bingLog啊？

DataWorks数据集成从MySQL至maxCompute使用整库全增量(准实时)，读取的是MySQL中的数据还是读取的bingLog啊？

展开

收起

真的很搞笑 2023-10-22 21:19:34 192 版权

3 条回答

写回答

取消提交回答

sunrr

在阿里云的DataWorks中，数据集成从MySQL至MaxCompute使用整库全增量（准实时）时，它并不是直接读取MySQL中的数据，而是读取MySQL的binlog。

这种模式的工作原理是，数据集成任务会定期从MySQL中抓取最新的binlog，然后解析binlog中的事件，提取出数据，然后将数据写入MaxCompute。这种方式可以实现实时的数据同步，但是需要MySQL支持binlog，并且需要保证binlog的完整性和一致性。

这种方式并不能保证数据的绝对实时性，因为数据集成任务可能会因为各种原因（如网络问题、系统故障等）而中断，导致数据无法及时同步。因此，如果需要实现绝对实时的数据同步，可能需要考虑其他的解决方案，如使用MaxCompute的实时接入功能。

2023-10-23 11:06:11

赞同展开评论
芯在这

第一次初始化使用的离线是用sql读的；后面实时增量读的是binlog，此回答整理自钉群“DataWorks交流群(答疑@机器人)”

2023-10-23 08:05:41

赞同展开评论
小周sir

面对过去，不要迷离；面对未来，不必彷徨；活在今天，你只要把自己完全展示给别人看。

在DataWorks中，从MySQL至MaxCompute使用整库全增量（准实时）的数据集成方式，读取的是MySQL中的数据。这种方式通过在MySQL数据库上设置binlog日志，将MySQL中的数据变更实时记录到binlog中。然后在DataWorks中，通过读取MySQL的binlog日志，将MySQL中的数据变更实时同步到MaxCompute中。
这种方式的优点是可以实现数据的实时同步，缺点是需要在MySQL上设置binlog日志，并且需要消耗一定的系统资源。同时，由于MySQL和MaxCompute的数据类型和存储方式可能不同，因此在进行数据同步时，可能需要进行一定的数据转换和格式化。
因此，您需要根据您的实际需求和环境，选择合适的数据集成方式。

2023-10-22 22:05:32

赞同展开评论

DataWorks读取的是MySQL中的数据还是读取的bingLog啊？

大数据计算 MaxCompute

相关文章

相关解决方案

热门讨论

热门文章