开发者社区 > 大数据与机器学习 > 大数据计算 MaxCompute > 正文

DataWorks读取的是MySQL中的数据还是读取的bingLog啊?

DataWorks数据集成从MySQL至maxCompute使用整库全增量(准实时),读取的是MySQL中的数据还是读取的bingLog啊?

展开
收起
真的很搞笑 2023-10-22 21:19:34 55 0
3 条回答
写回答
取消 提交回答
  • 在阿里云的DataWorks中,数据集成从MySQL至MaxCompute使用整库全增量(准实时)时,它并不是直接读取MySQL中的数据,而是读取MySQL的binlog。

    这种模式的工作原理是,数据集成任务会定期从MySQL中抓取最新的binlog,然后解析binlog中的事件,提取出数据,然后将数据写入MaxCompute。这种方式可以实现实时的数据同步,但是需要MySQL支持binlog,并且需要保证binlog的完整性和一致性。

    这种方式并不能保证数据的绝对实时性,因为数据集成任务可能会因为各种原因(如网络问题、系统故障等)而中断,导致数据无法及时同步。因此,如果需要实现绝对实时的数据同步,可能需要考虑其他的解决方案,如使用MaxCompute的实时接入功能。

    2023-10-23 11:06:11
    赞同 展开评论 打赏
  • 第一次初始化使用的离线 是用sql读的;后面实时增量读的是binlog,此回答整理自钉群“DataWorks交流群(答疑@机器人)”

    2023-10-23 08:05:41
    赞同 展开评论 打赏
  • 面对过去,不要迷离;面对未来,不必彷徨;活在今天,你只要把自己完全展示给别人看。

    在DataWorks中,从MySQL至MaxCompute使用整库全增量(准实时)的数据集成方式,读取的是MySQL中的数据。这种方式通过在MySQL数据库上设置binlog日志,将MySQL中的数据变更实时记录到binlog中。然后在DataWorks中,通过读取MySQL的binlog日志,将MySQL中的数据变更实时同步到MaxCompute中。
    这种方式的优点是可以实现数据的实时同步,缺点是需要在MySQL上设置binlog日志,并且需要消耗一定的系统资源。同时,由于MySQL和MaxCompute的数据类型和存储方式可能不同,因此在进行数据同步时,可能需要进行一定的数据转换和格式化。
    因此,您需要根据您的实际需求和环境,选择合适的数据集成方式。

    2023-10-22 22:05:32
    赞同 展开评论 打赏

MaxCompute(原ODPS)是一项面向分析的大数据计算服务,它以Serverless架构提供快速、全托管的在线数据仓库服务,消除传统数据平台在资源扩展性和弹性方面的限制,最小化用户运维投入,使您经济并高效的分析处理海量数据。

相关电子书

更多
搭建电商项目架构连接MySQL 立即下载
搭建4层电商项目架构,实战连接MySQL 立即下载
PolarDB MySQL引擎重磅功能及产品能力盛大发布 立即下载

相关镜像