文档备案控制台

开发者社区大数据与机器学习实时计算 Flink 正文

为了解决这个问题，我们引入了 source 合并的优化，我们会尝试合并同一作业中的 source，如

为了解决这个问题，我们引入了 source 合并的优化，我们会尝试合并同一作业中的 source，如果都是读的同一数据源，则会被合并成一个 source 节点，这时数据库只需要建立一个连接，binlog 也只需读取一次，实现了整库的读取，降低了对数据库的压力。 --请问这个合并一个source节点的功能，是在哪个版本支持，需要做什么样的配置？

展开

收起

雪哥哥 2022-11-13 20:17:01 341 版权

版权声明：本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

阿里云 AI 助理回答

合并Source节点的功能是在实时计算Flink版本中支持的，具体配置方法如下：

操作说明：
- 通过设置特定的作业参数，您可以启用Source复用功能，从而在同一个作业中将读取相同数据源的多个MySQL CDC Source合并为一个，减少数据库连接和Binlog读取的压力。
步骤与方法：
- 开启Source复用：在SQL作业中使用SET命令来激活此功能。
```
SET 'table.optimizer.source-merge.enabled' = 'true';
```
- 注意版本兼容性：确保您使用的实时计算引擎版本支持此功能。特别是VVR 8.0.8及8.0.9版本，在开启CDC Source复用时，还需要额外设置：
```
SET 'sql-gateway.exec-plan.enabled' = 'false';
```
注意事项：
- 版本要求：该功能适用于实时计算Flink版本，社区版MySQL CDC连接器不提供此支持。
- 作业启动方式：对已有作业启用Source复用后，建议无状态启动，因为拓扑结构的变化可能导致从原有状态启动失败或数据丢失。
- 算子链优化：避免将pipeline.operator-chaining设为false，以免引入额外的序列化和反序列化开销，尤其是在VVR 8.0.7版本中存在序列化问题。
示例与参考：上述配置基于参考资料中的最佳实践，旨在优化MySQL CDC作业的资源利用和数据库压力。

综上所述，通过在实时计算Flink版本的作业中正确配置Source复用参数，可以有效实现Source节点的合并，降低对MySQL数据库的连接需求和Binlog处理压力。请根据您的实际环境选择合适的版本并进行相应配置。

有帮助

无帮助

AI 助理回答生成答案可能存在不准确，仅供参考

0 条回答

写回答

取消提交回答

问答分类：

实时计算 Flink版

问答地址：

开发者社区 > 大数据与机器学习 > 实时计算 Flink > 问答

相关问答

实时计算 Flink版

访问ECS服务器的网站提示“由于你访问的URL可能对网站造成安全威胁，您的访问被阻断”，这是什么原因？

136507

16

0

#支付宝身份验证失败（人气大爆发，一会再试试）？

11123

2

0

支付宝H5 下载的时候，提示【请确保该下载文件来源安全,如需浏览,请长按网址复制后使用浏览器访问】

268256

11

0

#支付宝授权提示请在支付宝客户端打开链接

18806

19

0

购买阿里国外的云服务器是否可以访问谷歌？

87304

49

0

this xml file does not appear to have any style in

54950

11

0

今天刚刚买的阿里云香港服务器，国内无法访问，坑啊

35616

17

0

哪位有编译好的cdc 2.2.0版本能能试用flink 1.14.2的包呀？

2933

18

0

轻量级应用服务器端口问题（打不开）

32288

21

0

阿里云香港服务器在哪购买？香港云服务器购买流程有吗？

8279

5

0

大数据与机器学习

实时计算 Flink

实时计算Flink版是阿里云提供的全托管Serverless Flink云服务，基于 Apache Flink 构建的企业级、高性能实时大数据处理系统。提供全托管版 Flink 集群和引擎，提高作业开发运维效率。

我要提问

收录在圈子:

阿里云实时计算Flink

199215

+ 订阅

实时计算 Flink 版（Alibaba Cloud Realtime Compute for Apache Flink，Powered by Ververica）是阿里云基于 Apache Flink 构建的企业级、高性能实时大数据处理系统，由 Apache Flink 创始团队官方出品，拥有全球统一商业化品牌，完全兼容开源 Flink API，提供丰富的企业级增值功能。

相关文章

Apache Paimon多模态数据湖实践：从结构化到非结构化的技术演进

Fluss在阿里双11万亿规模场景下的落地实践

Apache Flink Agents 0.2.0 发布公告

基于Flink CDC的企业级日志实时入湖入流解决方案

Flink 实时计算 x SLS 存储下推：阿里云 OpenAPI 网关监控平台实践

热门讨论

热门文章

哪位有编译好的cdc 2.2.0版本能能试用flink 1.14.2的包呀？

Flink CDC任务从savepoint/checkpoints状态中恢复作业错误问题

flink1.19和hive3.1.3，cdc从mysql同步数据到hive，插入时报错？

Flink有2023 Flink Forward Asia 资料下载地址吗?

flinkcdc在IDEA运行正常，打包就报错

有用flink cdc同步mysql到hive这样搞过的源码吗?

Flink1.10 python API 对流式处理的支持度如何，能直接用于生产吗？

在Flink CDC中，直接将我生成的application会话kill掉了,有人遇到过吗？

这个不显示数据，大家怎么处理的

大佬们，请教下，Flink CDC2.4.0版本的mysql cdc，怎么设置时区"？

展开全部

数据仓库介绍与实时数仓案例

接着！！Apache Flink 全领域干货合集（持续更新）

史上超强阵容！大数据及人工智能领域顶级盛会，Flink Forward Asia 2019 不容错过！

Flink SQL 功能解密系列 —— 流计算“撤回(Retraction)”案例分析

Apache Flink 漫谈系列(04) - State

基于Flink的实时日志分析系统实践

携程实时智能检测平台建设实践

Flink SQL 功能解密系列 —— 解决热点问题的大杀器MiniBatch

实时计算无线数据分析

菜鸟供应链实时数仓的架构演进及应用场景

展开全部

还有其他疑问?