开发者社区 > 大数据与机器学习 > 实时计算 Flink > 正文

Flink 会根据 Sink 表上定义的主键进行 shuffle/partition 吗

2807问.png

展开
收起
游客3oewgrzrf6o5c 2022-08-09 14:24:01 335 0
1 条回答
写回答
取消 提交回答
  • CSDN全栈领域优质创作者,万粉博主;InfoQ签约博主;华为云享专家;华为Iot专家;亚马逊人工智能自动驾驶(大众组)吉尼斯世界纪录获得者

    是的,Flink会根据Sink表上定义的主键进行shuffle/partition。在Flink中,数据流被划分为多个分区(Partition),每个分区都会被发送到一个或多个Sink操作中。当Sink操作接收到数据时,它会根据主键将数据分配给不同的分区,以便在后续的处理过程中进行shuffle和join操作。因此,在定义Sink表时,需要指定主键以确保数据的正确分区和处理。

    2023-06-30 10:04:58
    赞同 展开评论 打赏

实时计算Flink版是阿里云提供的全托管Serverless Flink云服务,基于 Apache Flink 构建的企业级、高性能实时大数据处理系统。提供全托管版 Flink 集群和引擎,提高作业开发运维效率。

相关产品

  • 实时计算 Flink版
  • 相关电子书

    更多
    Flink CDC Meetup PPT - 龚中强 立即下载
    Flink CDC Meetup PPT - 王赫 立即下载
    Flink CDC Meetup PPT - 覃立辉 立即下载