备案控制台

开发者社区大数据与机器学习实时计算 Flink 正文

在Flink的checkpoint怎么设置checpoint保存策略？

基于FsStateBackend 的checkpoint,怎么设置checpoint保存策略。
Flink只需要这个参数吗？state.checkpoints.num-retained: 3
感觉没有用啊

展开

收起

三分钟热度的鱼 2023-09-27 14:21:49 230 版权

版权声明：本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

1 条回答

写回答

取消提交回答

清风拂袖

在 Flink 中，Checkpoint 的保存策略可以通过以下方式进行设置：

通过 CheckpointConfiguration 的 checkpointInterval 属性设置 checkpoints 的间隔时间。
通过 CheckpointConfiguration 的 minPauseBetweenCheckpoints 属性设置在两个 checkpoints 之间必须等待的最短时间。
通过 CheckpointConfiguration 的 maxConcurrentCheckpoints 属性设置同时可以进行的 checkpoints 的最大数量。
通过 CheckpointConfiguration 的 maxStateSize 属性设置每个 checkpoint 可以存储的数据的最大大小。
通过 CheckpointConfiguration 的 checkpointTimeout 属性设置每个 checkpoint 的超时时间。
通过 CheckpointConfiguration 的 failureRateThreshold 属性设置 checkpoint 失败率的阈值。
通过 CheckpointConfiguration 的 tolerableCheckpointFailureNumber 属性设置 checkpoint 失败次数的最大阈值。
以下是设置 checkpoint 保存策略的示例：

val checkpointConfig = new CheckpointConfig
checkpointConfig.setCheckpointInterval(1000)
checkpointConfig.setMinPauseBetweenCheckpoints(500)
checkpointConfig.setMaxConcurrentCheckpoints(1)
checkpointConfig.setMaxStateSize(1024 1024 1024)
checkpointConfig.setCheckpointTimeout(60000)
checkpointConfig.setFailureRateThreshold(0.5)
checkpointConfig.setTolerableCheckpointFailureNumber(2)
以上示例设置了以下 checkpoint 保存策略：

每个 1000 毫秒就会进行一次 checkpoint。
两个 checkpoint 之间必须至少间隔 500 毫秒。
同时最多只能进行一个 checkpoint。
每个 checkpoint 可以存储最多 1 GB 的数据。
每个 checkpoint 的超时时间为 60 秒。
如果一个 checkpoint 的失败率超过 50%，则会停止进行 checkpoint。
如果一个 checkpoint 失败超过 2 次，则会停止进行 checkpoint。
通过设置以上 checkpoint 保存策略，可以提高 checkpoint 的成功率，同时也能避免 checkpoint 占用过多的内存和资源。

2023-10-17 10:58:42

赞同展开评论

问答分类：

流计算实时计算 Flink版

问答标签：

实时计算 Flink版checkpoint 实时计算 Flink版设置实时计算 Flink版checkpoint设置实时计算 Flink版策略实时计算 Flink版设置策略

问答地址：

开发者社区 > 大数据与机器学习 > 实时计算 Flink > 问答

相关问答

实时计算 Flink版

flink on k8s 这个pod 重启策略只支持 always，怎么修改能让他支持？

591

2

0

Flink RestartStrategy 恢复策略

94

1

0

Flink专家模式下自动调优策略是怎么样的呢？

131

1

0

Flink作业重启策略如何配置

123

1

0

在Flink CDC中,cdc怎么配置重启策略啊？

129

1

0

在Flink CDC中chunk 切分策略可以用其他的策略吗？

87

0

0

对于Flink CDC，flink的任务失败恢复策略是从上一次的ckeckpoint中恢复？

60

1

0

Flink状态持久化策略有哪些

64

1

0

Flink维表缓存支持哪些策略

203

1

0

Flink Elasticsearch sink 更新策略

72

1

0

大数据与机器学习

实时计算 Flink

实时计算Flink版是阿里云提供的全托管Serverless Flink云服务，基于 Apache Flink 构建的企业级、高性能实时大数据处理系统。提供全托管版 Flink 集群和引擎，提高作业开发运维效率。

我要提问

相关文章

实时计算系列-----第一话：前言

Flink Agents：基于Apache Flink的事件驱动AI智能体框架

基于实时迭代的数值鲁棒NMPC双模稳定预测模型（Matlab代码实现）

基于模型预测控制对PMSM进行FOC控制，模拟控制了PMSM的速度（Simulink仿真实现）

解析pg_stat_replication状态字段的枚举值

热门讨论

热门文章

Flink CDC任务从savepoint/checkpoints状态中恢复作业错误问题

请问如何用flink sql客户端用yarn application模式提交任务呢？

请问下大家有没有遇到过这个错:Caused by: java.lang.ClassNotFoundE

flink-CDC-3.0 mysql to doris 数据同步任务经常报错

在斗鱼，实时计算发展的历程如何？

FlinkCDC MySQL 中 scan.startup.mode 用的是什么模式啊？

flink的1cu是指1cpu还是1cpu+4g存储？

Flink-CDC 文档网站地址是什么？

在Flink CDC中ogg可以做实时同步吗？

Flink CDC中，有哪位大佬有flink 版本和cdc版本的适配统计啊？

展开全部

Flink SQL 功能解密系列 —— 流计算“撤回(Retraction)”案例分析

基于Flink的实时日志分析系统实践

使用 Kafka 和 Flink 构建实时数据处理系统

【阿里内部应用】基于Blink为新商业调控打造实时大数据交互查询服务

Flink SQL 功能解密系列 —— 解决热点问题的大杀器MiniBatch

Apache Flink 零基础入门（三）：DataStream API 编程

如何分析及处理 Flink 反压？

Flink入坑指南第四章：SQL中的经典操作Group By+Agg

一文带你了解 Flink Forward 柏林站全部重点内容

Apache Flink 进阶（四）：Flink on Yarn/K8s 原理剖析及实践

展开全部

还有其他疑问?