如何配置dataworks导出任务?

如何配置dataworks导出任务?

展开
收起
真的很搞笑 2023-07-31 13:45:23 133 分享 版权
3 条回答
写回答
取消 提交回答
  • 北京阿里云ACE会长

    在DataWorks中,您可以通过数据集成的“数据同步”功能,实现数据从数据源的导入和导出。如果您想要配置DataWorks的导出任务,可以按照以下步骤进行操作:

    在DataWorks控制台中,选择“数据集成”,进入数据集成页面。

    在数据集成页面中,选择“数据同步”,进入数据同步页面。

    在数据同步页面中,点击“创建同步任务”按钮,创建一个新的数据同步任务。

    在同步任务配置页面中,选择“导出”作为同步方式。

    在同步源设置页面中,选择需要导出的数据源,并设置相应的导出选项(例如,选择需要导出的表和字段等)。

    在同步目标设置页面中,选择导出目标的存储位置(例如,OSS、MaxCompute等),并设置相应的导出选项(例如,文件格式、文件名等)。

    在同步任务设置页面中,设置任务名称、调度周期、同步模式、并发度等参数。

    2023-07-31 23:08:54
    赞同 展开评论
  • 要配置 DataWorks 中的导出任务,您可以按照以下步骤进行操作:

    1. 在 DataWorks 项目空间中,进入「数据集成」模块。

    2. 点击「新建任务」按钮,选择数据源类型和数据目标类型,以便设置导出任务。

    3. 根据您的需求选择相应的数据源类型。例如,如果要从 MaxCompute 导出数据,选择 MaxCompute 数据源。

    4. 在任务创建页面,填写任务名称和描述信息。

    5. 在数据同步节点中,选择「同步任务」。

    6. 配置源端数据存储,即指定要导出数据的表或文件。根据您选择的数据源类型不同,配置方式也会有所不同。例如,如果是 MaxCompute 数据源,可以选择要导出的表。

    7. 配置目标端数据存储,即指定导出数据的目标文件或数据库。根据您选择的数据目标类型不同,配置方式也会有所不同。例如,如果是文本文件,可以设置导出数据的文件路径、文件格式、字段分隔符等;如果是数据库,可以设置目标数据库连接信息。

    8. 根据需要,调整其他高级选项,如并行度、压缩格式等。

    9. 点击「确定」按钮创建任务。

    10. 运行该数据集成任务,即可执行导出操作。

    2023-07-31 15:36:22
    赞同 展开评论
  • 在DataWorks导出页面,单击右上方的新建导出任务。在新建导出任务对话框中,配置各项参数。image.png
    参数 描述
    导出名称 导出名称仅支持大小写字母、中文、数字、下划线和小数点。
    导出类型 选择全量导出,您将导出当前工作空间下所有已保存、已提交的周期任务、手动任务、表元数据和数据源。
    黑名单 您可以根据业务需求决定是否选中添加黑名单,以筛选全量导出过程中无需导出的任务和资源。
    导出版本格式 包括公共云和专有云(V3.6.1-V3.11)。DataWorks上不同版本的数据格式不一致,请先确认待导入环境中DataWorks的版本。
    备注 对导出任务进行简单描述。可选:添加黑名单并导出任务。如果您选中添加黑名单,请执行下述操作:在新建导出任务对话框中,单击添加黑名单。在选择黑名单页面,选择无需导出的对象。单击添加到黑名单。单击页面右上方的开始导出。在导出确认对话框中,单击确认。可选:如果您未选中添加黑名单,请直接单击开始导出。在导出进度对话框中,查看任务的导出进度。待导出成功后,单击返回导出任务列表。
    https://help.aliyun.com/document_detail/172913.html,此回答整理自钉群“DataWorks交流群(答疑@机器人)”

    2023-07-31 13:54:11
    赞同 展开评论

DataWorks基于MaxCompute/Hologres/EMR/CDP等大数据引擎,为数据仓库/数据湖/湖仓一体等解决方案提供统一的全链路大数据开发治理平台。

还有其他疑问?
咨询AI助理