开发者社区 > 大数据与机器学习 > 实时计算 Flink > 正文

如果不设置分布列,会造成什么问题?

如果不设置分布列,会造成什么问题?

展开
收起
Medusa 2021-11-12 13:28:00 358 0
1 条回答
写回答
取消 提交回答
  • 在进行关联查询时,Hologres 需要将 2 个表的数据根据 join key shuffle 到一起,保证数据的正确性。如果 shuffle 的数据量很大,会造成很高的查询延迟。

    2021-11-12 18:35:57
    赞同 展开评论 打赏

实时计算Flink版是阿里云提供的全托管Serverless Flink云服务,基于 Apache Flink 构建的企业级、高性能实时大数据处理系统。提供全托管版 Flink 集群和引擎,提高作业开发运维效率。

相关电子书

更多
重新定义计算的边界 立即下载
低代码开发师(初级)实战教程 立即下载
阿里巴巴DevOps 最佳实践手册 立即下载