开发者社区 > 大数据与机器学习 > 大数据开发治理DataWorks > 正文

如何批量更新已导入的历史数据值?

如何批量更新已导入的历史数据值?

展开
收起
滴滴滴~ 2023-03-29 14:05:26 252 0
2 条回答
写回答
取消 提交回答
  • 具体是啥场景 数据集成离线同步 部分writer插件支持跟新写入 。 此答案整理自钉群“DataWorks交流群(答疑@机器人)”

    2023-03-29 20:59:31
    赞同 展开评论 打赏
  • 月移花影,暗香浮动

    批量更新已导入的历史数据值可以通过 DataWorks 的数据集成(Data Integration)功能实现。具体步骤如下:

    1. 在 DataWorks 控制台选择数据集成,进入数据同步任务管理页面;
    2. 创建一个数据同步任务,选择源数据和目标数据,设置同步规则;
    3. 在同步任务的高级功能中,打开“批量修改写入记录速度”开关;
    4. 编辑同步引擎参数,将“batch_size”参数设置为适当的大小,可以一次性写入多条数据;
    5. 启动同步任务,等待同步完成。

    需要注意的是,在批量修改历史数据时,建议提前备份数据,避免误删或丢失数据。同时,需要确保修改操作不影响现有业务数据的正确性和一致性。

    2023-03-29 16:49:15
    赞同 展开评论 打赏

DataWorks基于MaxCompute/Hologres/EMR/CDP等大数据引擎,为数据仓库/数据湖/湖仓一体等解决方案提供统一的全链路大数据开发治理平台。

相关电子书

更多
低代码开发师(初级)实战教程 立即下载
冬季实战营第三期:MySQL数据库进阶实战 立即下载
阿里巴巴DevOps 最佳实践手册 立即下载