开发者社区> 问答> 正文

PolarDB支持哪些数据分发方式,并简述Shuffle的基本形态?

PolarDB支持哪些数据分发方式,并简述Shuffle的基本形态?

展开
收起
花开富贵111 2024-07-24 17:54:47 29 0
2 条回答
写回答
取消 提交回答
  • PolarDB支持Shuffle、Broadcast和Gather三种数据分发方式。Shuffle(Repartition)的基本形态是通过将数据根据指定的key或规则重新分配到不同的partition中,以确保具有相同key的数据位于同一partition内,从而支持后续的并行处理操作。

    2024-07-24 19:58:48
    赞同 1 展开评论 打赏
  • 数据分发策略,包括:

    • PQ_GATHER:数据汇总到上层1个worker中。

    • PQ_HASH:数据shuffle分发到上层多个worker中。

    • PQ_BROADCAST: 数据广播到上层多个worker中。

    • PQ_NONE:不做数据分发。

    目前PolarDB支持了Shuffle/Broadcast/Gather三种分发方式,实现上利用lock-free shared ring buffer,做到流水线模式的高效数据传输。

    下图展示了Shuffle(Repartition)的基本形态:
    image.png

    ——参考链接

    2024-07-24 19:26:50
    赞同 1 展开评论 打赏
问答排行榜
最热
最新

相关电子书

更多
云栖大会:开源 PolarDB 架构演进、关键技术与社区建设 立即下载
2023云栖大会:和客户一起玩转PolarDB新特性 立即下载
2023云栖大会:PolarDB for AI 立即下载