备案控制台

开发者社区大数据与机器学习正文

Flink CDC中有谁知道请问2.3版本默认还是走的全局锁对吧？

Flink CDC中有谁知道请问2.3版本默认还是走的全局锁对吧？

展开

收起

真的很搞笑 2023-05-29 14:05:25 93 版权

版权声明：本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

阿里云 AI 助理回答

在Flink CDC 2.3版本中，默认情况下仍然会使用全局锁（Global Lock）来保证数据一致性。这是因为在全量阶段（Snapshot Phase），为了确保读取的数据一致性，Flink CDC会对表加全局锁以防止数据在读取过程中被修改。

全局锁的作用

全局锁的主要目的是在全量数据同步阶段避免数据的并发修改，从而保证数据的一致性。然而，这种机制可能会对数据库的性能产生一定影响，尤其是在高并发写入的场景下。

如何跳过全局锁？

如果您希望避免全局锁的影响，可以通过以下方式跳过Snapshot阶段，直接从增量阶段（Binlog Phase）开始读取数据： 1. 配置参数：在创建CDC表时，通过设置'scan.startup.mode' = 'latest-offset'，可以跳过全量阶段，直接从最新的Binlog位置开始读取。

CREATE TABLE mysql_cdc_table (
    id INT,
    name STRING,
    PRIMARY KEY (id) NOT ENFORCED
) WITH (
    'connector' = 'mysql-cdc',
    'hostname' = 'your-hostname',
    'port' = '3306',
    'username' = 'your-username',
    'password' = 'your-password',
    'database-name' = 'your-database',
    'table-name' = 'your-table',
    'scan.startup.mode' = 'latest-offset'
);

注意：这种方式会丢失全量数据，仅适用于不需要全量同步的场景。

手动处理Snapshot：如果需要全量数据但又想避免全局锁，可以考虑手动导出全量数据并导入到目标端，然后通过Flink CDC从增量阶段开始同步。

数据库性能优化建议

如果必须使用全局锁，建议采取以下措施减轻对数据库的影响： - 低峰期执行：将全量同步任务安排在业务低峰期执行，减少对在线业务的影响。 - 分库分表：对于大规模数据，可以通过分库分表的方式分散锁的影响范围。 - 调整锁粒度：部分数据库支持调整锁的粒度（如表级锁或行级锁），可以根据实际情况进行优化。

总结

Flink CDC 2.3版本默认仍会使用全局锁来保证全量数据的一致性。如果需要避免全局锁的影响，可以通过配置scan.startup.mode跳过全量阶段，或者结合手动导出和增量同步的方式实现数据同步。在实际使用中，请根据业务需求权衡数据一致性和性能之间的关系。

有帮助

无帮助

AI 助理回答生成答案可能存在不准确，仅供参考

0 条回答

写回答

取消提交回答

问答分类：

流计算实时计算 Flink版

问答标签：

实时计算 Flink版CDC 实时计算 Flink版锁实时计算 Flink版版本实时计算 Flink版cdc版本实时计算 Flink版版本锁

问答地址：

开发者社区 > 大数据与机器学习 > 问答

相关问答

Flink CDC中pg cdc哪个版本开始不锁表的？

118

1

0

Flink默认先全量再增量同步，全量时会对checkpoint上锁，导致请求检查点时失败，任务重启

300

1

0

flink cdc 2.4.2 不是采用无锁算法吗？不需要数据库锁权限吗？

123

0

0

在Flink CDC中binlog 有读取锁的机制吗？

81

0

0

Flink k8s HA 锁资源在etcd偶发出现写失败时候，请教一下这个机制有优化的配置吗？

125

1

0

Flink CDC里自定义udf函数的eval有线程安全问题吗？需要加sync那个锁吗？

191

0

0

Flink CDC2.0以后不是已经实现了全程无锁吗？还需要自己设置吗？

366

2

0

各位大佬，请教一下，如果在flink cdc sql客户端使用SQL查询表，怎么能记录原系统的数据

2116

1

0

那cdc最新版支持到flink的哪个版本，flink1.15还有guava兼容性问题吗？

1258

0

0

flink cdc(mysql) -> elasticsearch7, 任务每次持续跑了一段时间之后

1277

2

0

大数据与机器学习

大数据领域前沿技术分享与交流，这里不止有技术干货、学习心得、企业实践、社区活动，还有未来。

我要提问

相关文章

前端的同学，终于要起飞啦，Github 6.3k star + ，免费可商用的UI元素库！！！

Flink 智能调优：从人工运维到自动化的实践之路

一图掌握通义千问：模型生态与应用场景全览

从“数据堆积如山”到“实时驱动业务”——聊聊Kafka到Flink的实时数据处理演进

牛B，我去，新手小白也能使用InfiniteTalk搭建属于自己的数字人啦，真的太简单啦！！！

热门讨论

热门文章

P人出游，你是否需要一个懂你更懂规划的AI导游呢？来搭建专属文旅问答机器人吧

Flink CDC任务从savepoint/checkpoints状态中恢复作业错误问题

实验中 Elasticsearch、es kibana login 的默认用户和口令是什么？

虚拟机占用内存特别大，90多个G,网上各种方法都试过了，怎么解决这个问题

PAI做了线性回归的模型，预测结果后，回归模型评估的节点，结果R2的值是负的，我理解R2的取值范围?

Flink sql将数组炸开，实现hive的explode函数的效果，还有什么其他好的方式？

DataWorks表管理创建表报precision and scale is not current

Flink用jdbc catalog连接postgresql时pg的schema里有横线该怎么处理？

2018spark技术问答集锦，希望能给喜欢spark的同学一些帮助

Flink1.17为什么需要JDK 11呢？JDK8我试了也能运行

展开全部

DataV首次实战分享：教你30分钟创建汽车大屏

数据库开放权限太危险，又不想写API。DataV给你另外一个选择。

你刚吃的兰州牛肉面，背后就藏着大数据

大数据环境下该如何优雅地设计数据分层

odps是什么?

ajax请求总是不成功？浏览器的同源策略和跨域问题详解

【技术实验】mysql准实时同步数据到Elasticsearch

数据仓库介绍与实时数仓案例

DataV接入ECharts图表库可视化利器强强联手

分布式快照算法: Chandy-Lamport

展开全部

还有其他疑问?