Flink这个state记录啥东西需要记这么多的?

Flink这个state记录啥东西需要记这么多的?1dcc75bbe14f211fbba28b5021d9cb7b.png

展开
收起
三分钟热度的鱼 2023-08-08 11:39:41 89 分享 版权
2 条回答
写回答
取消 提交回答
  • 北京阿里云ACE会长

    窗口数据:当使用窗口操作(如滚动窗口、滑动窗口)时,状态用于存储窗口内的数据。这样可以在窗口触发时进行聚合、计算或其他操作。

    状态化的操作结果:在一些场景中,您可能需要记住先前的操作结果,以便能够在后续的数据到达时进行比较、计算或更新。

    聚合数据:状态可以用于存储聚合数据,例如计数、求和、平均值等。这样可以实时地跟踪和更新聚合结果。

    去重数据:状态可以用于去重,确保相同的数据不会被重复处理。

    连接数据:在一些操作中,您可能需要将不同的数据流连接在一起,并将连接信息存储在状态中。

    状态机:状态可以被用于实现有限状态机,帮助跟踪和控制作业的执行流程。

    2023-08-08 18:17:53
    赞同 展开评论
  • checkpoint/state 大小和数据量、业务复杂度、ttl 等配置息息相关,建议带着作业链接走工单 case by case 分析下~此回答整理自钉群“实时计算Flink产品交流群”

    2023-08-08 12:11:00
    赞同 展开评论

实时计算Flink版是阿里云提供的全托管Serverless Flink云服务,基于 Apache Flink 构建的企业级、高性能实时大数据处理系统。提供全托管版 Flink 集群和引擎,提高作业开发运维效率。

还有其他疑问?
咨询AI助理