问题一:我使用Flink CDC 3.0对mysql整库同步到starrock中,任务挂掉是为啥?
我使用Flink CDC 3.0对mysql整库同步到starrock中,现在任务已经创建好了,mysql的表和数据都同步到starrock中了,现在发现的问题是,我在源表加了新字段,接着flink的任务就挂掉了是为什么?
参考答案:
将时间调长一点。你这个问题我也遇到了 我给你解释下 FlinkCDC捕捉到了一个Schema变更的日志,然后交给StartRocks的sink去执行,StarRocks的sink执行完Schema变更后,需要向jobmaster那边去汇报这个operatorEvent,然后这个汇报超时了:
超时的原因可能是StarRocks更新schema花费的时间太长了,jobmanger等的时间是默认的时间pekko.ask.timeout=10s,但是StarRocks还没更新列成功,这时JobManager就会抛出异常通信超时。
你尝试修改pekko.ask.timeout这个参数为120s,不过当JobManager等待StarRocks的sink汇报operatorEvent的过程中JobManager的resutapi是无法访问的,这个会引起Flink任务状态不准确的问题。
关于本问题的更多回答可点击进行查看:
https://developer.aliyun.com/ask/592268
问题二:flink cdc 这个错是什么问题导致的呢?
flink cdc insert-only records but DataStream API record contains: UPDATE_BEFORE 这个错是什么问题导致的呢?
参考答案:
在 Apache Flink CDC 的应用场景中,如果配置为仅处理 INSERT 操作(insert-only mode),但在 DataStream API 中仍收到了 UPDATE_BEFORE 类型的记录,这可能由以下几个原因造成:
- 配置问题:
- 确保在设置 Flink CDC 连接器时指定了正确的同步模式,例如在使用 MySQL CDC 连接器时,应将
sync-mode
参数设置为SYNC_MODE_INSERT_ONLY
。这样,连接器只会生成 INSERT 类型的事件,而忽略 UPDATE 和 DELETE 操作。
- 源表变更:
- 检查是否有变更发生在 Flink CDC 作业运行期间,比如表结构或 CDC 配置的变更,导致原本应该是 INSERT_ONLY 的表出现了 UPDATE_BEFORE 记录。
- 旧数据重复处理:
- 如果作业曾经使用过全量同步模式,后来改为 INSERT_ONLY 模式,但历史数据中的 UPDATE_BEFORE 记录仍然存在于 Kafka 等中间存储中,Flink 作业重新消费时可能会再次处理这些记录。
- 连接器内部逻辑错误:
- 极少数情况下,可能是连接器自身逻辑的 bug 导致,即使在 INSERT_ONLY 模式下也会错误地生成了 UPDATE_BEFORE 记录。这种情况下,建议检查连接器版本并查看官方文档或 issue tracker,如有必要升级到最新稳定版本或联系社区寻求帮助。
- 其他组件配置影响:
- 如果使用了其他中间组件(如 Debezium 等),也需要检查这些组件的配置是否与 Flink CDC 的 INSERT_ONLY 模式相匹配。
关于本问题的更多回答可点击进行查看:
https://developer.aliyun.com/ask/592267
问题三:Flink CDC里 flink集群jps命令 报错怎么办?
Flink CDC里 flink集群jps命令 报错java.lang.OutOfMemoryError: unable to create new native thread 内存不足无法创建新的进程 我看了下机器内存情况 好像确实不多了 但是buffer 和available里面有 是不是没释放啊 ?
参考答案:
可能的原因
OutOfMemoryError: unable to create new native thread出现的情况有两种:
- 服务器剩余内存不足(非JVM内存),不能创建新的线程
- 超出服务器用户最大进程限制:
ulimit -u。
关于本问题的更多回答可点击进行查看:
https://developer.aliyun.com/ask/592258
问题四:有人用过Flink CDC 3.0版本的整库同步吗?
有人用过Flink CDC 3.0版本的整库同步吗?我用Flink CDC3.0整库同步mysql到starRock提交任务异常,有人遇到过这个问题吗?
参考答案:
先保持原来的参数,任务写到另外的文件里。
关于本问题的更多回答可点击进行查看:
https://developer.aliyun.com/ask/592256
问题五:Flink CDC里没有报错,但是一直监听不到数据,是需要什么参数配置吗 ?
Flink CDC里使用flinksql oracle cdc 代码正常起来,没有报错,但是一直监听不到数据,是需要什么参数配置吗 ?一直捕获不到数据,打印到控制台也没有什么输出,建表语句是这个CREATE TABLE source_order (
ID INT,
PRICE DOUBLE,
DESC
STRING,
CREATE_TIME TIMESTAMP,
UPDATE_TIME TIMESTAMP
)WITH (
'connector' ='oracle-cdc',
'hostname' = '10.190.228.33',
'port' = '1521',
'username' = 'xxx',
'password' = 'xxx',
'database-name' = 'xxx',
'schema-name' = 'xxx',
'table-name' ='T_ORDER',
'debezium.log.database.tablename.case.insensitive'='false',
'debezium.log.mining.strategy' = 'online_catalog',
'debezium.log.mining.continuous.mine' = 'true'
)
参考答案:
试一下这个'debezium.database.tablename.case.insensitive'='false',
'debezium.database.serverTimezone'='Asia/Shanghai',
'debezium.log.mining.strategy'='online_catalog'或者自己在工具中debug一下cdc源码,看看是哪儿没获取到日志。
关于本问题的更多回答可点击进行查看: