实时计算 Flink版产品使用问题之任务在同步过程中新增同步表后选择全量初始化历史数据，是否会阻塞原先其余表的增量同步-阿里云开发者社区

实时计算 Flink版产品使用问题之任务在同步过程中新增同步表后选择全量初始化历史数据，是否会阻塞原先其余表的增量同步

2024-06-15 279

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： 实时计算Flink版作为一种强大的流处理和批处理统一的计算框架，广泛应用于各种需要实时数据处理和分析的场景。实时计算Flink版通常结合SQL接口、DataStream API、以及与上下游数据源和存储系统的丰富连接器，提供了一套全面的解决方案，以应对各种实时计算需求。其低延迟、高吞吐、容错性强的特点，使其成为众多企业和组织实时数据处理首选的技术平台。以下是实时计算Flink版的一些典型使用合集。

问题一：Flink cdc在同步过程中新增同步表后选择全量初始化历史数据，会阻塞原先其余表的增量同步吗？

Flink cdc任务在同步过程中新增同步表后选择全量初始化历史数据，会阻塞原先其余表的增量同步么？

参考答案：

新增表不影响其他，有个feature是新增表不断流。增量数据从任务开始就在同步了。历史数据同步及binlog同步在全量阶段是并行执行的，在全量阶段，增量同步的数据会跟全量切片数据进行去重合并发往下游。

关于本问题的更多回答可点击进行查看：

https://developer.aliyun.com/ask/607348

问题二：锁表会导致 flink任务的GC吗？

锁表会导致 flink任务的GC吗？

参考答案：

只要内存足够，下游消费快，一般不会出现这个问题。

关于本问题的更多回答可点击进行查看：

https://developer.aliyun.com/ask/607346

问题三：Flink CDC里你们在oracle 上面是单独建了一个 cdc的用户吗？

Flink CDC里你们在oracle 上面是单独建了一个 cdc的用户吗？现在 2.0 以上会出现锁表的情况不？

根据这些语句，单独创建的用户吗？

参考答案：

是的。你这个是CDB的赋权模式。你要看PDB的。

关于本问题的更多回答可点击进行查看：

https://developer.aliyun.com/ask/607342

问题四：Flink CDC里有没有java版本的开源学习 demo?

Flink CDC里有没有java版本的开源学习 demo?

参考答案：

可以看源码，也可以去Test看样例。

关于本问题的更多回答可点击进行查看：

https://developer.aliyun.com/ask/607341

问题五：Flink CDC里通过datastream从mysql写到kafka中文乱码要配置什么的?

Flink CDC里通过datastream从mysql写到kafka中文乱码要配置什么的?

参考答案：

在 Apache Flink CDC 项目中，从 MySQL 数据库通过 DataStream API 将数据同步到 Kafka 时，如果遇到中文乱码问题，需要确保在多个环节正确配置字符编码。以下是需要检查和配置的部分：

MySQL 字符集配置：

确保 MySQL 数据库的表字符集设置为支持中文的字符集，例如 utf8mb4。

Flink CDC 字符集配置：

在 Flink CDC 连接 MySQL 的配置中，设置与 MySQL 数据库字符集匹配的字符集参数，例如：

connector.property characterEncoding=utf8mb4
table.exec.connectors.mySql.default-character-set=utf8mb4

Flink 程序内部字符集：

在 Flink 程序启动参数中设置 JVM 的默认字符集为 UTF-8，以确保内部处理过程中编码统一：

--conf env.java.opts="-Dfile.encoding=UTF-8"

Kafka 生产者编码配置：

在 Flink 将数据写入 Kafka 时，确保 Kafka 生产者配置中指定的序列化器支持 UTF-8 编码，例如使用 ByteArraySerializer 或 StringSerializer 并确保其内部处理字符集为 UTF-8：

Properties kafkaProducerConfigs = new Properties();
kafkaProducerConfigs.setProperty("key.serializer", "org.apache.kafka.common.serialization.StringSerializer");
kafkaProducerConfigs.setProperty("value.serializer", "org.apache.kafka.common.serialization.StringSerializer"); // 或 ByteArraySerializer

Kafka Topic 的字符集：

虽然 Kafka 默认的消息编码是字节数组，但如果要将数据以字符串形式存储并确保中文正确显示，需要确保下游消费应用在处理数据时也能正确识别 UTF-8 编码。

确保所有环节的字符集设置一致且都是 UTF-8，可以大大降低出现中文乱码问题的概率。如果使用的是 Flink CDC 提供的 MySQL Source 连接器，同样需要在连接器配置中指定正确的字符集。如果仍然存在问题，请检查日志以获取更详细的错误信息，并针对性地解决问题。

关于本问题的更多回答可点击进行查看：

https://developer.aliyun.com/ask/607336

实时计算 Flink版产品使用问题之任务在同步过程中新增同步表后选择全量初始化历史数据，是否会阻塞原先其余表的增量同步

问题一：Flink cdc在同步过程中新增同步表后选择全量初始化历史数据，会阻塞原先其余表的增量同步吗？

问题二：锁表会导致 flink任务的GC吗？

问题三：Flink CDC里你们在oracle 上面是单独建了一个 cdc的用户吗？

问题四：Flink CDC里有没有java版本的开源学习 demo?

问题五：Flink CDC里通过datastream从mysql写到kafka中文乱码要配置什么的?