开发者社区 > 大数据与机器学习 > 大数据开发治理DataWorks > 正文

DataWorks中odps 引擎得with as走的是内存吗?

DataWorks中odps 引擎得with as走的是内存吗?

展开
收起
真的很搞笑 2023-12-30 13:55:06 212 0
2 条回答
写回答
取消 提交回答
  • 在阿里云DataWorks中使用MaxCompute(原名ODPS)引擎时,WITH AS子句创建的临时表并不直接走内存。在执行SQL语句的过程中,WITH AS会生成一个中间结果集,这个结果集存储在分布式文件系统上,而非内存中。

    MaxCompute是一个基于云计算的大数据处理服务,它的设计原理是将大规模数据分布在集群的多个节点上进行计算和存储,而不是依赖单个节点的内存资源。因此,即使使用了WITH AS来创建临时视图或者中间结果,这些数据最终还是以分布式文件的形式存在,并在后续查询过程中按需读取和计算。

    2023-12-30 18:11:42
    赞同 展开评论 打赏
  • 面对过去,不要迷离;面对未来,不必彷徨;活在今天,你只要把自己完全展示给别人看。

    在DataWorks的PyODPS节点中,当使用with as子句时,其处理的数据主要是存储在内存中的。这是因为,PyODPS为MaxCompute的Python版SDK,它在执行任务时会占用一定的系统资源,如CPU和内存。具体来说,Map Task每个Instance的Memory大小是可以设定的,单位是M,范围通常在 [256,12288]之间调整。然而,如果数据量过大,可能会导致内存使用超限,进程被杀死。因此,在使用with as等操作时,需要特别注意内存的使用情况,避免本地数据的大量操作,以减小对系统资源的压力。

    2023-12-30 15:56:56
    赞同 1 展开评论 打赏

DataWorks基于MaxCompute/Hologres/EMR/CDP等大数据引擎,为数据仓库/数据湖/湖仓一体等解决方案提供统一的全链路大数据开发治理平台。

相关产品

  • 大数据开发治理平台 DataWorks
  • 热门讨论

    热门文章

    相关电子书

    更多
    DataWorks数据集成实时同步最佳实践(含内测邀请)-2020飞天大数据平台实战应用第一季 立即下载
    DataWorks调度任务迁移最佳实践-2020飞天大数据平台实战应用第一季 立即下载
    基于DataWorks数据服务构建疫情大屏-2020飞天大数据平台实战应用第一季 立即下载