文档备案控制台

开发者社区大数据与机器学习实时计算 Flink 正文

flink - sink - mysql，commit阶段失败了，那这数据是什么状态？我的理解，正常

flink - sink - mysql，commit阶段失败了，那这数据是什么状态？我的理解，正常jdbc开启事务，如果抛异常失败的话那这条数据就丢失了，因为只有checkpoint触发后才会提交事务的，offset在什么时候保存的呢，kafka(source) -> flink -> (sink)mysql

展开

收起

真的很搞笑 2023-08-01 12:59:36 352 版权

版权声明：本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

1 条回答

写回答

取消提交回答

芯在这

异常了抛出去然后异常任务恢复重启吧，抛异常失败，flink不报错？是否对异常捕获，继续让程序running，还是只是打印日志，在 Flink 中，Two-Phase Commit Sink Function 是一种用于实现 Exactly-Once 语义的协议。它通过两个阶段的提交来保证事务的一致性和可靠性。

在 Two-Phase Commit Sink Function 协议中，每次数据更新并不会直接更新偏移量。相反，它遵循以下步骤：

预提交阶段（Pre-commit Phase）：当 Flink Sink Function 收到要写入下游系统（如数据库）的数据时，会将数据暂时缓存在内部状态中，同时生成一个与该事务相关的偏移量。在预提交阶段，偏移量并不会被更新。

提交阶段（Commit Phase）：在 Flink Job 完成检查点（Checkpoint）时，Flink 会触发 Two-Phase Commit Sink Function 的提交阶段。在这个阶段，Sink Function 会将之前预提交的数据写入下游系统，并在写入成功后更新偏移量，表示该事务已经成功提交。

通过此协议，偏移量的更新仅在提交阶段完成时进行。这样做的好处是能够确保在发生故障或失败时，Flink 可以通过重新执行两阶段提交协议来保证事务的一致性。如果在预提交阶段或提交阶段失败，Flink 可以借助检查点机制来自动恢复到一致状态，并重新提交失败的事务。

需要注意的是，Two-Phase Commit Sink Function 需要 Sink Function 和下游系统（如数据库）的支持，下游系统需要提供事务性写入的能力，并且 Two-Phase Commit Sink Function 本身也需要能够与下游系统进行交互来实现两阶段提交协议。

总结起来，使用 Two-Phase Commit Sink Function 协议时，偏移量的更新是在事务成功提交后进行的，以确保事务的一致性和可靠性。，此回答整理自钉群“Flink CDC 社区”

2023-08-01 13:03:31

赞同展开评论

问答分类：

消息中间件关系型数据库 MySQL Java Kafka 数据库连接流计算实时计算 Flink版云数据库 RDS MySQL 版云消息队列 Kafka 版

问答标签：

云数据库 RDS MySQL 版数据实时计算 Flink版数据 flink云数据库 RDS MySQL 版实时计算 Flink版mysql 实时计算 Flink版mysql数据

问答地址：

开发者社区 > 大数据与机器学习 > 实时计算 Flink > 问答

相关问答

实时计算 Flink版

在Flink CDC中3.1 pipline sink还不支持mysql 吗？

214

0

0

Flink CDC3.0什么时候支持sink到mysql呀？

542

0

0

flink cdc pipline有计划支持mysql 作为sink的吗？

219

1

0

在Flink CDC中flinksql写入到mysql的sink应该怎么写？

171

0

0

FlinkCDC里Mysql 视图有没有遇到多个source,一个sink的时候，sink会少数据？

257

0

0

flink cdc pipeline配置文件那种sink支持MySQL吗？

243

1

0

Flink CDC里MySQL CDC Pipeline 连接器支持配置sink到mysql吗？

331

1

0

flink cdc不支持sink到mysql嘛？

654

3

0

Flink CDC自定义的sink端连接mysql久了报错，有人知道怎么解决吗？

269

0

0

Flink CDC中哪位亲有 datastream 的 mysql sink 的 demo？

311

0

0

大数据与机器学习

实时计算 Flink

实时计算Flink版是阿里云提供的全托管Serverless Flink云服务，基于 Apache Flink 构建的企业级、高性能实时大数据处理系统。提供全托管版 Flink 集群和引擎，提高作业开发运维效率。

我要提问

相关文章

【AgentScope Java新手村系列】（18）Skills技能系统

从“会写”到“会调”：SQL调优进阶的5个思维升级

云原生架构实战：连锁商超从多租户 SaaS 逃离到私有化独立部署的底层逻辑

数据中台平台能力评估：一文看懂数据中台5层架构

Xshell、MobaXterm 之外的新选择：uniTerm 开源终端软件，不到 10MB，覆盖 20+ 协议

相关解决方案

更多

Flink 与 Hologres 搭建实时数仓

Flink CDC 实现企业级实时数据同步

数据护航：数据库敏感数据防护

基于数据闪回，快速恢复数据

通过 RocketMQ 实现分布式事务

热门讨论

热门文章

哪位有编译好的cdc 2.2.0版本能能试用flink 1.14.2的包呀？

Flink CDC任务从savepoint/checkpoints状态中恢复作业错误问题

flinkcdc在IDEA运行正常，打包就报错

Flink CDC 能适配达梦不？

有用flink cdc同步mysql到hive这样搞过的源码吗?

flink1.19和hive3.1.3，cdc从mysql同步数据到hive，插入时报错？

在Flink想实时汇总数据，类似数据大屏功能，应该用阿里云Flink的什么功能服务？

flink CDC 当第一次全量正常输出后，源表中数据任何变更就无法再被捕获到了，为什么？

Flink CDC全量没问题，增量报错 file is not a valid field name

如何用实时数据同步打破企业数据孤岛？

展开全部

数据仓库介绍与实时数仓案例

基于Flink的实时日志分析系统实践

Flink: 快速构建统一的实时日志平台

Apache Flink 漫谈系列(15) - DataStream Connectors之Kafka

开篇 | 揭秘 Flink 1.9 新架构，Blink Planner 你会用了吗？

【阿里内部应用】利用blink+MQ实现流计算中的超时统计问题

计算广告与流处理技术综述

Flink入坑指南第四章：SQL中的经典操作Group By+Agg

如何在 Flink 1.9 中使用 Hive？

【阿里内部应用】基于Blink构建亲听项目以及全链路debug项目实时响应能力

展开全部

还有其他疑问?