开发者社区 > 大数据与机器学习 > 实时计算 Flink > 正文

在设计Segment Key时,需要注意什么?

在设计Segment Key时,需要注意什么?

展开
收起
Medusa 2021-11-12 16:13:53 340 0
1 条回答
写回答
取消 提交回答
  • 以在设计 Segment Key 的时候,尽可能不要有 Overlap,尽可能顺序地递增。如果数据写入非常无序,比如写进来的数据,先是 123,然后 678,然后 456,这种乱序的写入就会导致 Segment Key 可能在不同的文件内部有重复的数据,使得 Segment Key 完全没有起到查询过滤的作用。

    因此,设计 Segment Key 最关键的一点就是尽可能单调,并且没有 Overlap,这样才可以让我们能够尽可能跳过这种不必要的数据扫描。

    资料来源:《实时数仓“王炸组合”-实时计算》,下载链接:https://developer.aliyun.com/topic/download?id=7944

    2021-11-12 18:34:47
    赞同 展开评论 打赏

实时计算Flink版是阿里云提供的全托管Serverless Flink云服务,基于 Apache Flink 构建的企业级、高性能实时大数据处理系统。提供全托管版 Flink 集群和引擎,提高作业开发运维效率。

相关电子书

更多
低代码开发师(初级)实战教程 立即下载
冬季实战营第三期:MySQL数据库进阶实战 立即下载
阿里巴巴DevOps 最佳实践手册 立即下载