开发者社区 > 大数据与机器学习 > 大数据计算 MaxCompute > 正文

如何优化odps存储空间,降低使用率?

如何优化odps存储空间,降低使用率?

展开
收起
游客i2i5j3xkpqrwe 2023-01-12 16:56:36 728 0
5 条回答
写回答
取消 提交回答
  • ODPS将分区列的每个值作为一个分区(目录)。用户可以指定多级分区,即将表的多个字段作为表的分区,分区之间正如多级目录的关系

    2023-01-19 10:23:39
    赞同 展开评论 打赏
  • 更好的终点可以放在ods,明确接入ods的数据,避免重复接入,增量表汇总从全量表,避免数据的刻意冗余

    2023-01-19 10:23:08
    赞同 展开评论 打赏
  • 更好的终点可以放在ods,明确接入ods的数据,避免重复接入,增量表汇总从全量表,避免数据的刻意冗余

    2023-01-19 10:13:33
    赞同 展开评论 打赏
  • 一般来说,想从cdm和ads中省出空间难度比较高,毕竟每张表都有对应的用处,更好的终点可以放在ods,明确接入ods的数据,避免重复接入,增量表汇总从全量表,避免数据的刻意冗余

    2023-01-12 19:42:43
    赞同 展开评论 打赏
  • 网站:http://ixiancheng.cn/ 微信订阅号:小马哥学JAVA

    合理设置分区表 ODPS支持分区表的概念,分区表指的是在创建表时指定的partition的分区空间,即指定表内的某几个字段作为分区列。在大多数情况下,用户可以将分区类比为文件系统下的目录。 ODPS将分区列的每个值作为一个分区(目录)。用户可以指定多级分区,即将表的多个字段作为表的分区,分区之间正如多级目录的关系。在使用数据时如果指定了需要访问的分区名称,则只会读取相应的分区,避免全表扫描,提高处理效率,降低费用.

    2023-01-12 17:56:04
    赞同 展开评论 打赏

MaxCompute(原ODPS)是一项面向分析的大数据计算服务,它以Serverless架构提供快速、全托管的在线数据仓库服务,消除传统数据平台在资源扩展性和弹性方面的限制,最小化用户运维投入,使您经济并高效的分析处理海量数据。

相关产品

  • 云原生大数据计算服务 MaxCompute
  • 相关电子书

    更多
    DataWorks数据集成实时同步最佳实践(含内测邀请)-2020飞天大数据平台实战应用第一季 立即下载
    DataWorks商业化资源组省钱秘籍-2020飞天大数据平台实战应用第一季 立即下载
    基于DataWorks数据服务构建疫情大屏-2020飞天大数据平台实战应用第一季 立即下载