DataWorks不仅提供单表离线模式，还支持多种数据同步任务类型。-阿里云开发者社区

DataWorks不仅提供单表离线模式，还支持多种数据同步任务类型。

2024-03-22 93

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

本文涉及的产品

大数据开发治理平台DataWorks，Serverless资源组抵扣包300CU*H

简介： 【2月更文挑战第31天】DataWorks不仅提供单表离线模式，还支持多种数据同步任务类型。这些类型包括整库离线同步（一次性全量同步、周期性全量同步、离线全增量同步、一次性增量同步、周期性增量同步）以及一键实时同步（一次性全量同步，实时增量同步）。此外，DataWorks还提供了数据类型转换的功能，您可以选择在源端和目标端使用相同的数据类型以避免数据类型转换，或者在源端和目标端使用不同的数据类型，然后在同步时手动转换数据类型。

DataWorks不仅提供单表离线模式，还支持多种数据同步任务类型。这些类型包括整库离线同步（一次性全量同步、周期性全量同步、离线全增量同步、一次性增量同步、周期性增量同步）以及一键实时同步（一次性全量同步，实时增量同步）。此外，DataWorks还提供了数据类型转换的功能，您可以选择在源端和目标端使用相同的数据类型以避免数据类型转换，或者在源端和目标端使用不同的数据类型，然后在同步时手动转换数据类型。

在DataWorks中，您可以使用赋值节点将上下文传输下来的二维数组保存到表中。首先，您需要在上游节点中将需要传递的二维数组作为输出参数（outputs）设置好。然后，在下游的赋值节点中，将这个输出参数连接到一个ODPS SQL节点，以便将这个二维数组写入到MaxCompute表中。请注意，数据同步中心仅支持能够抽象为逻辑二维表的数据同步。同时，由于节点上下文中的资源非常受限，例如PyODPS节点的内存限制较强，因此在处理大型数据时需要谨慎操作。

DataWorks的全局参数没有特定的版本限制。然而，对于不同版本的DataWorks，支持使用的系统参数和自定义参数可能会有所不同。例如，DataWorks提供了两个系统参数：${bdp.system.cyctime}和${bdp.system.bizdate}，这两个参数在后续版本的DataWorks中可能会有所调整或增加。

此外，您需要注意的是，某些特定功能可能会受到使用限制。例如，当您在使用PyODPS节点时，由于内存使用的限制，如果任务执行过程中发生"Got killed"错误，这表示内存使用超过了限制。在这种情况下，建议避免在PyODPS节点中直接下载大量数据并在DataWorks中进行处理，或者避免在PyODPS节点中写入过多的数据处理代码。对于包的支持也有限制，例如，DataWorks的PyODPS节点不支持matplotlib等一些包。

因此，为了确保您的任务可以正常运行，建议您在使用DataWorks时充分了解其对各种操作和使用方式的限制，并根据实际情况进行相应的配置和调整。

相关实践学习

基于MaxCompute的热门话题分析

本实验围绕社交用户发布的文章做了详尽的分析，通过分析能得到用户群体年龄分布，性别分布，地理位置分布，以及热门话题的热度。

一站式大数据开发治理平台DataWorks初级课程

DataWorks 从 2009 年开始，十ー年里一直支持阿里巴巴集团内部数据中台的建设，2019 年双 11 稳定支撑每日千万级的任务调度。每天阿里巴巴内部有数万名数据和算法工程师正在使用DataWorks，承了阿里巴巴 99%的据业务构建。本课程主要介绍了阿里巴巴大数据技术发展历程与 DataWorks 几大模块的基本能力。课程目标  通过讲师的详细讲解与实际演示，学员可以一边学习一边进行实际操作，可以深入了解DataWorks各大模块的使用方式和具体功能，让学员对DataWorks数据集成、开发、分析、运维、安全、治理等方面有深刻的了解，加深对阿里云大数据产品体系的理解与认识。适合人群  企业数据仓库开发人员  大数据平台开发人员  数据分析师  大数据运维人员  对于大数据平台、数据中台产品感兴趣的开发者

DataWorks不仅提供单表离线模式，还支持多种数据同步任务类型。

热门文章

最新文章

相关课程

相关电子书

相关实验场景

热门

活动广场

任务中心

开发者评测

高校计划

乘风者计划

训练营

阿里云MVP

话题

直播

下载

镜像站

技术资料

插件

DataWorks不仅提供单表离线模式，还支持多种数据同步任务类型。

热门文章

最新文章

相关课程

相关电子书

相关实验场景