开发者社区> 问答> 正文

用mapreduce怎么处理数据倾斜问题呢?

用mapreduce怎么处理数据倾斜问题呢?

展开
收起
真的很搞笑 2021-12-05 00:58:57 304 0
1 条回答
写回答
取消 提交回答
  • 本质:让各分区的数据分布均匀

    可以根据业务特点,设置合适的partition策略

    如果事先根本不知道数据的分布规律,利用随机抽样器抽样后生成partition策略再处理

    2021-12-05 00:59:12
    赞同 展开评论 打赏
问答排行榜
最热
最新

相关电子书

更多
HBase 吞吐量提升实践 立即下载
HBase中Coprocessor的介绍以及实际业务场景中的使用 立即下载
HBase Rowkey设计要点 立即下载