实时计算 Flink版产品使用合集之在一个任务中创建了多个MySQLCDC源表，这些源表是否共享同一个数据库连接池-阿里云开发者社区

实时计算 Flink版产品使用合集之在一个任务中创建了多个MySQLCDC源表，这些源表是否共享同一个数据库连接池

2024-05-23 83

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

本文涉及的产品

实时计算 Flink 版，5000CU*H 3个月

简介： 实时计算Flink版作为一种强大的流处理和批处理统一的计算框架，广泛应用于各种需要实时数据处理和分析的场景。实时计算Flink版通常结合SQL接口、DataStreamAPI、以及与上下游数据源和存储系统的丰富连接器，提供了一套全面的解决方案，以应对各种实时计算需求。其低延迟、高吞吐、容错性强的特点，使其成为众多企业和组织实时数据处理首选的技术平台。以下是实时计算Flink版的一些典型使用合集。

问题一：fink创建catalog，创建完成后，在元数据管理这个catalog下面没有有任何库是什么原因呢？

fink创建maxcompute的catalog，创建完成后，在元数据管理这个catalog下面没有任何库是什么原因呢？

参考答案：

登陆的账号没有权限。

关于本问题的更多回答可点击进行查看：

https://developer.aliyun.com/ask/578534

问题二：Flink的MongoDB cdc 不支持从checkpoint重启吗？

Flink的MongoDB cdc 不支持从checkpoint重启吗？这边重启了两次都没成功。主键是字符串_id

参考答案：

Flink的MongoDB Change Data Capture (CDC) 功能确实支持从checkpoint重启，但是在某些情况下可能会遇到问题。以下是一些可能导致无法成功从checkpoint恢复的原因：

1. 不兼容的驱动版本：
Flink MongoDB CDC可能依赖于特定版本的MongoDB Java Driver。如果使用了不兼容或有bug的驱动版本，可能会导致无法正常监听数据变化。

1. 主键格式问题：
在您的案例中，您提到主键是字符串_id。确保在Flink的连接配置和代码中正确处理这种类型的主键。例如，如果您正在使用的Flink connector不支持字符串作为主键类型，那么可能需要修改代码来适应这种情况。

1. resume token的问题：
Flink MongoDB CDC会定期将resume token写入checkpoint，以便在任务失败或重启时可以从中恢复。如果订阅的集合变更缓慢，或者Flink作业停止的时间超过了resume token的有效期，那么可能需要重新从头开始消费变更事件。

1. 心跳事件的影响：
变更流中的心跳事件也可能影响到resume token的更新和恢复。在某些情况下，心跳事件可能会触发Flink任务错误地认为自己已经错过了某些变更事件，从而尝试从头开始消费。

1. Checkpoint完整性问题：
如果Flink的checkpoint本身存在问题，例如在写入过程中发生中断，那么这些checkpoint可能无法用于成功的恢复。

1. 其他环境因素：
网络问题、数据库服务器状态改变以及其他与系统环境相关的因素都可能影响Flink任务从checkpoint恢复的能力。

为了确定具体原因并解决问题，请检查以下方面：

检查Flink作业的日志文件，查看是否有详细的错误信息。

验证所使用的MongoDB Java Driver版本是否与Flink MongoDB CDC兼容。

核实Flink作业的配置和代码是否正确处理了字符串类型的主键。

检查checkpoint目录的内容，确认它们包含有效的resume token信息。

联系Flink社区或寻求技术支持，提供详细的信息以获取专业的帮助。

关于本问题的更多回答可点击进行查看：

https://developer.aliyun.com/ask/578533

问题三：在Flink如果购买包年包月的话要一直留至少一个cu来进行session 是吗？

在Flink如果购买包年包月的话要一直留至少一个cu来进行session 是吗？

参考答案：

在阿里云的实时计算Flink全托管服务中，如果您购买的是包年包月的服务，并且使用了Session模式，那么您确实需要确保至少有一个CU（Compute Unit）处于运行状态。这是因为Session模式下，Flink会为您的工作负载保持一个长期存在的集群资源。

这个要求的原因是，在Session模式下，Flink会将多个作业共享到同一个持久化的集群上，这样可以减少每次提交作业时的启动和停止开销。为了保证这种持久化的能力，您需要保留至少一个CU来维护这个集群资源。当没有作业运行时，该CU会被用于维持集群的基本运行成本，而不会释放。

关于本问题的更多回答可点击进行查看：

https://developer.aliyun.com/ask/578532

问题四：Flink在同一个任务中，创建了多个mysql cdc源表，这些源表会复用同一个连接池嘛？

Flink在同一个任务中，创建了多个mysql cdc源表，这些源表会复用同一个连接池嘛？

参考答案：

是，参考https://help.aliyun.com/zh/flink/developer-reference/mysql-connector?spm=a2c4g.11186623.0.0.77f470a4PAN1YF#section-mxk-9ip-5kv

关于本问题的更多回答可点击进行查看：

https://developer.aliyun.com/ask/578531

问题五：Flink这个session是一定要空出来不能使用是吗？

开启session 测试的时候配置最低都要2cu，如果买了5cu，作业运维已经使用了 5cu了，那这个session 不是开启不了了，另外Flink这个session是一定要空出来不能使用是吗？

参考答案：

是的哈，session常驻进程占用资源。经常1cu测试，

关于本问题的更多回答可点击进行查看：

https://developer.aliyun.com/ask/578530

实时计算 Flink版产品使用合集之在一个任务中创建了多个MySQLCDC源表，这些源表是否共享同一个数据库连接池

问题一：fink创建catalog，创建完成后，在元数据管理这个catalog下面没有有任何库是什么原因呢？

问题二：Flink的MongoDB cdc 不支持从checkpoint重启吗？

问题三：在Flink如果购买包年包月的话要一直留至少一个cu来进行session 是吗？

问题四：Flink在同一个任务中，创建了多个mysql cdc源表，这些源表会复用同一个连接池嘛？

问题五：Flink这个session是一定要空出来不能使用是吗？