开发者社区> 问答> 正文

【每日一题】DataWorks-数据同步该用什么资源组?

【每日一题】DataWorks-数据同步该用什么资源组?

可爱.png

很多用户在使用数据集成建立同步任务时,往往都会困惑一个设置,即“资源组设置”。

大家常有的疑问是“资源组是用来做什么的?跟网络之间什么关系?我该选择那种资源组?”

展开
收起
问问小秘 2020-03-09 16:48:39 2259 1
1 条回答
写回答
取消 提交回答
  • 什么是资源组

    资源组是数据集成用来运行数据同步任务的计算资源,可以通俗的理解为“带有CPU、内存和网络的计算机或计算机集群”。同步任务就是运行在上面的“程序”。所以如果机器性能低或者运行的程序过多,都会导致任务执行效率,而有如果机器的网络不通,那么也会出现连接不到数据源的问题。

    对比和推荐

    数据集成有三种资源组:公共资源组(又称默认资源组)、独享资源组、自定义资源组。它们适用的场景不同,您在做数据同步时可以根据自己实际的需求来选择。具体请参考下表

    image.png

    任务执行效率:是指任务是否能分到足够的计算资源,能否以最高性能运行。
    可靠性:是指任务是否能按时启动,执行时网络资源是否被其他租户所占据,而导致任务不能按时产出结果。
    自定义资源组:此处仅指“用于数据集成的自定义资源组”,并不是“用于调度的自定义资源组”。

    结论

    所以综合来看对于大多数正常需求的用户来说“独享资源组”是最佳选择。

    DataWorks百问百答历史记录请点击查看https://developer.aliyun.com/ask/274440

    2020-03-09 16:56:06
    赞同 1 展开评论 打赏
问答排行榜
最热
最新

相关电子书

更多
被窝里的运维——DataWorks移动版公测-2020飞天大数据平台实战应用第一季 立即下载
DataWorks调度任务迁移最佳实践-2020飞天大数据平台实战应用第一季 立即下载
MaxCompute技术公开课第四季 之 如何将Kafka数据同步至MaxCompute 立即下载