开发者社区 > 大数据与机器学习 > 大数据开发治理DataWorks > 正文

您好~DataWorks已经依据文档说明配置了任务并发,但是离线同步任务还是很慢,能否帮忙看看是哪?

您好~DataWorks已经依据文档说明配置了任务并发,但是离线同步任务还是很慢,能否帮忙看看是哪的瓶颈问题导致无法提高离线同步速率?
"speed": {
"throttle": false,
"executeMode": "distribute",
"byte": 10485760,
"concurrent": 32
}

展开
收起
真的很搞笑 2023-06-10 18:55:22 97 0
1 条回答
写回答
取消 提交回答
  • 一般非跨地域 跨主账号 同步的任务 很少会出现带宽到达上限的情况 数据库本身的读写性能也会影响同步速度 ,从同步任务本身角度看 目前最有效的方式是增加并发,看了下日志 实际的并发数只有1 且读端 耗时久 我确认下是lindom特性导致 还是有切分建之类的原因
    "parameter":{
    。。。
    "splitKey": "xxxx" //切分列,必须是表主键。
    },
    方便加一下这个参数试试吗?尽量填数值类型 分布均匀的主键,此回答整理自钉群“DataWorks交流群(答疑@机器人)”

    2023-07-20 15:24:27
    赞同 展开评论 打赏

DataWorks基于MaxCompute/Hologres/EMR/CDP等大数据引擎,为数据仓库/数据湖/湖仓一体等解决方案提供统一的全链路大数据开发治理平台。

相关产品

  • 大数据开发治理平台 DataWorks
  • 热门讨论

    热门文章

    相关电子书

    更多
    DataWorks数据集成实时同步最佳实践(含内测邀请)-2020飞天大数据平台实战应用第一季 立即下载
    DataWorks调度任务迁移最佳实践-2020飞天大数据平台实战应用第一季 立即下载
    DataWorks商业化资源组省钱秘籍-2020飞天大数据平台实战应用第一季 立即下载

    相关实验场景

    更多