问题一:Flink CDC现在有一些这样的库,里面的table都是一样的。 正则应该咋样写啊?
Flink CDC现在有一些这样的库,里面的table都是一样的。 我想监听这些库里的一个表的变更,我的配置是这样的。databaselist的正则应该咋样写啊?现在只监听到了其他的变更都没有收到消息 是我的database的正则写错了吗?
参考回答:
首先,Flink CDC支持在TiDB上使用,并且可以通过TiDB CDC连接器获取实时变化的数据。为了监听多个库中的相同表,你可以使用正则表达式来匹配你想要监听的所有库名。例如,如果你想要监听名为my_db_1、my_db_2、my_db_3等多个库中的my_table表,那么可以将database.whitelist设置为mydb\d+。
另外,请确保你的Flink CDC配置正确,包括必要的连接参数和表模式信息。如果还有问题,请提供更多关于错误或警告的信息,
关于本问题的更多回答可点击原文查看:https://developer.aliyun.com/ask/566191
问题二:Flink CDC中oracle cdc能感知到源表结构发生变更么?
Flink CDC中oracle cdc能感知到源表结构发生变更么?
参考回答:
可以
关于本问题的更多回答可点击原文查看:https://developer.aliyun.com/ask/566190
问题三:flink-sqlserver-cdc-2.4.0 ,回滚到 2.3.0 版本,就没有问题,为什么?
flink-sqlserver-cdc-2.4.0 ,采用的默认的配置'scan.startup.mode' = 'initial',只能完成之前的全量数据,增量数据不能同步,但是配置为latest-offset,是可以获取增量数据的。回滚到 2.3.0 版本,initial 就没有问题,sqlserver 版本 2017?
参考回答:
上面问题,临时将 2.4.0 的快照的 checkpoint 设置为false('scan.incremental.snapshot.enabled'='false'
),可以恢复正常,原因还没来得及看
关于本问题的更多回答可点击原文查看:https://developer.aliyun.com/ask/566184
问题四:Flink CDC我在做一个测试练习,并行度2,实际上每个并行度只读取了一次?
Flink CDC我在做一个测试练习,并行度2,一个表里面有3000W的记录,我把cdc的chunk.size设置成5的时候,实际上每个并行度只读取了一次?
是因为这样这个chunks太大了吗?
参考回答:
加内存吧
关于本问题的更多回答可点击原文查看:https://developer.aliyun.com/ask/566183
问题五:Flink CDC中flinksql 维表实时更新延迟,都是怎么处理?
Flink CDC中flinksql 维表实时更新延迟,都是怎么处理?怎么让主流数据在关联不到维表的情况下,不输出过段时间再去关联
参考回答:
在Flink SQL中,可以采用几种方法处理维表实时更新延迟:
- 保持实时关联:通过重试和优先处理维表数据来降低延迟;
- 添加缓冲区:缓存主表和维表,等待一段时间后再进行同步;
- 使用流式窗口或者实时ETL等技术来处理不同步的情况;
- 设置超时时间来平衡同步效果和效率。
关于本问题的更多回答可点击原文查看:https://developer.aliyun.com/ask/566177