【百问百答】Flink CDC 数据源问题合集

1、请问Flink CDC可以在一个作业里面将数据源的不同数据以某种自定义规则同步到不同的hive库里？

2、请问Flink CDC同步postgresql全量数据时，如果源表发生了修改，全量期间的修改？

3、请问Flink CDC中oraclecdc 写数据出现的游标问题怎么解决呢，目前我是每条数据操作后会释放，但是发现多任务写入同一数据源的时候会出现数据库连接释放冲突问题，您遇到过吗？

4、Flink CDC中今天在同步数据时报这个数值不匹配的问题，能给指导下这是哪块儿的问题么？源mysql 目标:starrocks

5、Flink CDC如何提高下游的消费能力？我现在insert table 下游的算子已经红

6、Flink CDC中大佬们遇到数据源是Posegresql 主从集群，报一下错有遇到的吗？

7、请教一下， flink oracle cdc ， job启动可以获取全量源表数据，但是源表执行?

8、 Flink CDC中自定义redis数据源，定时扫描key，然后供下游使用，请问下多并行度意义不大吧？

9、，Flink CDC中我两个job里分别是不同的mysqlcdc源，两个源的表结构是一样的？

10、请教一下，这种是Flink CDC数据源连接问题吗？

11、为啥Flink CDC出来的数据是这种啊源表是utf8编码 sink到holo也是utf8编码 cdc读的mysql的binlog为啥会出现这种数据需要转换成啥格式才行啊？

12、FlinkCDC 不也需要部署Flink集群才能充分发挥作用莫，直接部署？

13、flink cdc这种报错是数据源连接问题吗?

14、Flink CDC 使用datastream api同步数据到jdbc数据库时，中间需要把源库binlog数据转成jdbc库的对应SQL，这个需要自行实现，还是有内置呢？就是jdbc连接器。jdbc连接pgsql

15、Flink CDC这个源表更新或者插入数据sink表为啥没有更新啊

16、flink cdc 能捕获数据源DDL变更吗？捕获后是怎么处理的？

17、flink CDC 当第一次全量正常输出后，源表中数据任何变更就无法再被捕获到了，为什么

18、请问flink sql cdc同步同一个mongo数据源到mysql中数据条目正确，但同步是到doris中数据存在很多重复数据是啥原因？

19、请问flink-cdc数据源是oracle/mysql 目标端是hdfs/doris/mysql.这种长时间增量拉取，能保证数据一致性么

20、对于Flink CDC，基于分片的读取数据源，并行读取，数据库日志，如果是有新增、有修改、有删除，随机分布在日志里，这样能切分开，并行执行吗，也只通是按顺序串行执行吧？

21、请问下flink cdc有提供什么手段对比源端和目标端同步数据一致性的方案没?

22、请问一个flink-cdc 任务可以连俩个不同mysql数据源吗？二个完全不同的 mysql实例

23、我这边目前情况是：oracle cdc，flink1.16版本，我启动了三十多个job，每个job都是多张表进行关联，目前oracle源表数据量不大，但是启动之后会将oracle服务器（100G内存左右）资源耗尽，最后报错ora-04030，不知道有没有遇见过类似的情况，如何调优之类的

24、需要create table，这样对用不是太方便。理想方式，只需要配置数据源连接，通过catalog 自动查找表。flink cdc 怎么定制这样的catalog？ SELECT id, UPPER(name), description, weight FROM mysql_binlog;

25、源端mysql中 A B C 三张表是同一个事物处理的，那我通过flink cdc实时同步到目标数据库，有没有也能够保证A B C三张表的数据同时同步过去呢？现在分成了3个JOB,发现有时候数据有点对不上

26、做flink cdc同步mysql到Doris测试的时候，Flink CDC flinkcdc同步mysql数据源时，有数据，但是无法插入到Doris sink源数据表中，帮忙看看是不是我的参数配置的不对，还是jar包少了，搞了将近2天了，还是搞不好

27、Flink-CDC 采集 Oracle 数据发送到下游 kafka 或其他存储端时, 数据不断膨胀的问题 (例如: Oracle源库9千万, kafka端2~30亿), 如果不手动关闭采集程序数据就会一直进来

28、flink cdc mysql源配置了'debezium.snapshot.mode'='never' ，不起作用，依然会同步全量数据，可能是什么原因呢

29、flink cdc for oracle select * from flinkuser.log_mining_flush这个表数据SCN到当前位置了。但是目标端延迟几个小时，怎么排查是不是目标端写入慢还是源端

30、通过flink cdc写hudi，如果源表比较大，是不是也需要获取全表的数据后才会做checkp

31、flinkcdc sql连接oracle12c报这种问题是原因呢？stream api没有这种问题，讲道理跟kafka没有什么关系呗只要源端有数据变动就会报这种错误，flink1.16，flinkcdc2.3

32、请问用flink cdc同步mysql的数据到starrocks，源表与目标表的类型是和mysql一样吗？有类型映射关系表吗？

33、使用flink cdc 2.1.1版本进行mysql到kafka的数据同步，正常同步了一个月时间，昨天数据库下线，flink cdc job没有抛出异常，看日志一直在不断重连数据库，重连了十几个小时，我们希望上游源数据库出现问题，flink cdc能够立即感觉，有什么办法吗？

34、Flink CDC 的上游支持了哪些数据源？

35、Flink CDC 的下游支持了哪些数据源？

36、cdc数据源还不支持窗口聚合吗？

37、Flink1.10版本的CDC是否支持SQL SERVER作为数据源？

38、flink cdc在抽取oracle全量数据之前会加表级排他锁，由于源端表数量大，在万张以上，锁表时长可能出现不可控的情况，而且对业务影响巨大。有没有方法解决这个问题

39、Flink CDC如何提高下游的消费能力？我现在insert table 下游的算子已经红

40、Flink CDC中大佬们遇到数据源是Posegresql 主从集群，报一下错有遇到的吗？

41、请教一下， flink oracle cdc ， job启动可以获取全量源表数据，但是源表执行?

42、请问Flink CDC中oraclecdc 写数据出现的游标问题怎么解决呢，目前我是每条数据操作后会释放，但是发现多任务写入同一数据源的时候会出现数据库连接释放冲突问题，您遇到过吗？

43、Flink CDC中今天在同步数据时报这个数值不匹配的问题，能给指导下这是哪块儿的问题么？源mysql 目标:starrocks

44、Flink CDC如何提高下游的消费能力？我现在insert table 下游的算子已经红

45、请问一个flink-cdc 任务可以连俩个不同mysql数据源吗？二个完全不同的 mysql实例

46、我这边目前情况是：oracle cdc，flink1.16版本，我启动了三十多个job，每个job都是多张表进行关联，目前oracle源表数据量不大，但是启动之后会将oracle服务器（100G内存左右）资源耗尽，最后报错ora-04030，不知道有没有遇见过类似的情况，如何调优之类的

47、需要create table，这样对用不是太方便。理想方式，只需要配置数据源连接，通过catalog 自动查找表。flink cdc 怎么定制这样的catalog？ SELECT id, UPPER(name), description, weight FROM mysql_binlog;

Flink CDC 可以在一个作业里面将数据源的不同数据以某种自定义规则同步到不同的 Hive 库里。

具体来说，您可以通过编写 Flink 程序来实现数据的同步。在 Flink CDC 中，您可以使用 Flink 的 DataStream API 或者 Table API 来编写程序，从而将数据源的不同数据以某种自定义规则同步到不同的 Hive 库里。

例如，您可以使用 Flink 的 Table API 来实现这个功能。具体来说，您可以通过以下步骤来实现：

使用 Flink CDC 读取数据源中的数据，并将数据转换成 Flink 的 Table。

对 Table 进行自定义规则的转换和处理，例如根据某个字段的值将数据分流到不同的 Table 中。

将处理后的 Table 写入到不同的 Hive 表中。

【百问百答】Flink CDC 数据源问题合集

实时计算 Flink

相关文章

热门讨论

热门文章