开发者社区 > 大数据与机器学习 > 大数据开发治理DataWorks > 正文

数据集成开启分布式同步,独享集成资源组显示只有一台机器在使用资源?独享资源组只能选择一个能选一个?

数据集成开启分布式同步,独享集成资源组显示只有一台机器在使用资源?独享资源组只能选择一个能选一个?如何开启分布式?b2f2ec1598f23f1a1609926b6cb461d0.png d11f345e02498c300c0b8b4d9b44e6c4.png dc10ab1561f971a9bf547a18d430d557.png

展开
收起
哒哒哒哒哒~ 2023-03-08 13:27:20 420 0
1 条回答
写回答
取消 提交回答
  • 月移花影,暗香浮动

    数据集成中开启分布式同步需要具备以下条件: - 使用高性能型号的节点(比如3H16X、4H16X、8H16X); - 开启了分布式任务调度功能(需要联系数加客服开通)。

    当使用独享资源组时,如果该资源组中只有一台节点,并且该节点正在被其他任务使用,则独享资源组会显示只有一台机器在使用资源。

    独享资源组只能选择一个节点,因为该资源组是专门为某个任务保留的资源,在该任务运行时,只能由该任务使用。

    开启分布式同步的方法: 1. 进入数据集成工作空间,选择需要进行分布式同步的作业; 2. 在作业配置页面中,选择“高级配置”选项卡; 3. 在“高级配置”页面中,找到“启用分布式同步”选项,并打开开关; 4. 单击“保存”按钮,保存作业配置; 5. 启动作业,等待任务调度系统自动进行资源调度和分配。

    需要注意的是,开启分布式同步后,虽然可以大幅提升同步速度,但也会消耗更多的计算资源,因此需要根据实际情况进行合理的配置,避免对其他任务的影响。

    2023-03-08 14:07:51
    赞同 展开评论 打赏

DataWorks基于MaxCompute/Hologres/EMR/CDP等大数据引擎,为数据仓库/数据湖/湖仓一体等解决方案提供统一的全链路大数据开发治理平台。

热门讨论

热门文章

相关电子书

更多
Cloud Foundry on Cloud-- 开源PaaS集成技术实现 立即下载
DataWorks数据集成实时同步最佳实践(含内测邀请)-2020飞天大数据平台实战应用第一季 立即下载
《DataWorks 数据集成实时同步》 立即下载

相关实验场景

更多