开发者社区 > 大数据与机器学习 > 大数据开发治理DataWorks > 正文

DataWorks目前用的是公共资源,两种方案在600w数据量下,是加速服务更快吗?

DataWorks目前用的是公共资源,两种方案在600w数据量下,是加速服务更快吗?image.png
有没有对比的文档可供参考

展开
收起
真的很搞笑 2023-11-14 07:48:53 44 0
3 条回答
写回答
取消 提交回答
  • DataWorks数据服务提供了两种加速方案:加速服务和MCQA。公共资源组是所有用户共享使用的资源组,在高峰期可能存在不同用户间抢占资源的情况。相比之下,独享资源组则是一种专属于单个用户使用的资源组,可以有效避免资源被其他用户抢占,保证任务的稳定运行。

    当处理大数据量时,如600万条数据,使用加速服务可能会带来更好的性能表现,提升数据处理效率。然而,具体效果可能会因任务类型、数据规模以及系统环境等因素而有所不同。因此,建议您根据实际业务需求和场景进行选择。

    2023-11-30 14:16:08
    赞同 展开评论 打赏
  • 面对过去,不要迷离;面对未来,不必彷徨;活在今天,你只要把自己完全展示给别人看。

    当您的数据量达到600万行时,使用 DataWorks 加速服务可以获得更好的性能。这是因为加速服务可以优化数据处理和传输过程,加快整个任务的速度。
    以下是两种方案的主要差异:

    1. 使用公共资源:使用公共资源可以节省成本,但在处理大量数据时可能会受到性能限制。公共资源一般更适合处理少量数据。
    2. 使用加速服务:使用加速服务可以大大提高任务的执行速度,并支持更多复杂的数据处理任务。加速服务最适合处理大量数据,尤其是在处理大型数据分析项目时。
    2023-11-14 13:50:33
    赞同 展开评论 打赏
  • 更建议用加速服务 通过holo外表的加速方式 ,此回答整理自钉群“DataWorks交流群(答疑@机器人)”

    2023-11-14 11:52:40
    赞同 展开评论 打赏

DataWorks基于MaxCompute/Hologres/EMR/CDP等大数据引擎,为数据仓库/数据湖/湖仓一体等解决方案提供统一的全链路大数据开发治理平台。

相关产品

  • 大数据开发治理平台 DataWorks
  • 热门讨论

    热门文章

    相关电子书

    更多
    DataWorks高效数据分析最佳实践-2020飞天大数据平台实战应用第一季 立即下载
    DataWorks数据集成实时同步最佳实践(含内测邀请)-2020飞天大数据平台实战应用第一季 立即下载
    DataWorks调度任务迁移最佳实践-2020飞天大数据平台实战应用第一季 立即下载