开发者社区 问答 正文

为什么将大表修改为哈希分布表可以节约存储空间?

为什么将大表修改为哈希分布表可以节约存储空间?

展开
收起
花开富贵111 2024-07-24 18:45:26 46 分享 版权
1 条回答
写回答
取消 提交回答
  • 将大表从复制表(DISTRIBUTED REPLICATED)修改为哈希分布表(DISTRIBUTED BY)可以节约存储空间,因为复制表需要在每个Segment上存储完整的数据拷贝,这对于大表来说是非常消耗存储空间的。而哈希分布表则根据分布键将数据分散到各个Segment上,每个Segment只存储部分数据,从而显著减少了总的存储空间需求。image.png

    2024-07-24 20:09:03
    赞同 1 展开评论
问答地址: