请教大家下列的问题,麻烦看看有没有解决办法?

请教个问题, 1、使用了RocksDB状态后端, 状态使用了 MapState,如果在这个MapState存了大量的数据,比如十几个G的数据,那么在 遍历这个MapState的时候,是把这十几G的数据全部都读取到内存中吗? 2、keyby后 使用Reduce,统计的数据是按状态存储吗,还是单纯的存到内存里,使用cp或sp重启作业还能获取到之前统计的数据吗

展开
收起
圆葱猪肉包 2023-03-21 14:39:25 210 分享 版权
1 条回答
写回答
取消 提交回答
  • GitHub https://github.com/co63oc/cloud

    可以使用iterator()循环读取 https://nightlies.apache.org/flink/flink-docs-master/api/java/org/apache/flink/api/common/state/MapState.html image.png 数据可以状态存储,也可以存内存,数据保存在RocksDB可以再读取

    2023-03-24 14:59:44
    赞同 展开评论

实时计算Flink版是阿里云提供的全托管Serverless Flink云服务,基于 Apache Flink 构建的企业级、高性能实时大数据处理系统。提供全托管版 Flink 集群和引擎,提高作业开发运维效率。

收录在圈子:
实时计算 Flink 版(Alibaba Cloud Realtime Compute for Apache Flink,Powered by Ververica)是阿里云基于 Apache Flink 构建的企业级、高性能实时大数据处理系统,由 Apache Flink 创始团队官方出品,拥有全球统一商业化品牌,完全兼容开源 Flink API,提供丰富的企业级增值功能。
还有其他疑问?
咨询AI助理