实时计算 Flink版产品使用问题之假如mysql的binlog有很多个文件,按什么顺序扫描

简介: 实时计算Flink版作为一种强大的流处理和批处理统一的计算框架,广泛应用于各种需要实时数据处理和分析的场景。实时计算Flink版通常结合SQL接口、DataStream API、以及与上下游数据源和存储系统的丰富连接器,提供了一套全面的解决方案,以应对各种实时计算需求。其低延迟、高吞吐、容错性强的特点,使其成为众多企业和组织实时数据处理首选的技术平台。以下是实时计算Flink版的一些典型使用合集。

问题一:在测试环境用flink cdc正则同步mysql分表,当作业启动后有新增分表,也能同步到吗?

在测试环境用flink cdc正则同步mysql分表,当作业启动后有新增分表,也能同步到,但是在生产上的mysql表就不能,还有对于新增字段,这边是用api整条数据同步的,测试环境也能同步到,生产上新增字段的数据竟然也不能同步到,这是和mysql的配置有关么?这样就不支持在扩大采集库的范围后从savepoint恢复。



参考答案:

动态加表都必须启停作业才能实现,不能自动加表。其实你可以用两个cdc任务, 1个专门用于分表的, 另外一个就用于不分表的,或者直接升级到3.1这些都不用考虑了。

https://github.com/apache/flink-cdc/issues/2306



关于本问题的更多回答可点击进行查看:

https://developer.aliyun.com/ask/607253



问题二:FLINk CDC 2.4版本文档是这个吗?好像和以前的差不多?

FLINk CDC 2.4版本文档是这个吗?好像和以前的差不多?



参考答案:

中文资料链接,CDC Source 文档就是2.4版本的。2.4 和 3.x,对于老的CDC source,一样的。



关于本问题的更多回答可点击进行查看:

https://developer.aliyun.com/ask/607250



问题三:Flink CDC中如果要保证业务的同时,进行同步flinkcdc可以控制速率吗?api怎么设置啊?

Flink CDC中如果要保证业务的同时,进行同步flinkcdc可以控制速率吗?api怎么设置啊?有具体可以设置的参数名字吗?



参考答案:

用api可以,自己调API开发,自己做条数限制。



关于本问题的更多回答可点击进行查看:

https://developer.aliyun.com/ask/607248



问题四:Flink CDC里oracle全量的时候卡在这里不动了怎么回事呀?

我要同步oracle 无主键表。

启动模式是initial时

如果开启了增量快照,那么我下游print输出的记录条数有问题 输出条数永远和切分出来的chunk数相等

如果不开启增量快照,那么作业直接卡着没有任何反应

是为什么呢?



参考答案:

如果读oracle ,日志疯狂增长的话,应该是需要在with中配置下这两个参数。

'debezium.log.mining.strategy' = 'online_catalog',

'debezium.log.mining.continuous.mine' = 'true' 。



关于本问题的更多回答可点击进行查看:

https://developer.aliyun.com/ask/607241



问题五:Flink CDC里假如mysql的binlog有很多个文件,按什么顺序扫描?

Flink CDC里假如mysql的binlog有很多个文件,一小时一个,用mysql-cdc读取binlog 指定开始策略为时间戳,现在的实现是从第一个binlog文件扫source.ts_ms 还是按照binlog文件的更新时间或者创建时间判断从哪个文件开始扫?



参考答案:

目前的按照时间戳查找就是按照binlog一条条过滤的,如果你binlog文件多且大,就是很慢

,master目前有binglog二分查找算法,可以解决你的问题的。



关于本问题的更多回答可点击进行查看:

https://developer.aliyun.com/ask/607240

相关实践学习
基于Hologres+Flink搭建GitHub实时数据大屏
通过使用Flink、Hologres构建实时数仓,并通过Hologres对接BI分析工具(以DataV为例),实现海量数据实时分析.
实时计算 Flink 实战课程
如何使用实时计算 Flink 搞定数据处理难题?实时计算 Flink 极客训练营产品、技术专家齐上阵,从开源 Flink功能介绍到实时计算 Flink 优势详解,现场实操,5天即可上手! 欢迎开通实时计算 Flink 版: https://cn.aliyun.com/product/bigdata/sc Flink Forward Asia 介绍: Flink Forward 是由 Apache 官方授权,Apache Flink Community China 支持的会议,通过参会不仅可以了解到 Flink 社区的最新动态和发展计划,还可以了解到国内外一线大厂围绕 Flink 生态的生产实践经验,是 Flink 开发者和使用者不可错过的盛会。 去年经过品牌升级后的 Flink Forward Asia 吸引了超过2000人线下参与,一举成为国内最大的 Apache 顶级项目会议。结合2020年的特殊情况,Flink Forward Asia 2020 将在12月26日以线上峰会的形式与大家见面。
相关文章
|
消息中间件 关系型数据库 MySQL
基于 Flink CDC YAML 的 MySQL 到 Kafka 流式数据集成
基于 Flink CDC YAML 的 MySQL 到 Kafka 流式数据集成
1404 0
|
11月前
|
SQL 关系型数据库 MySQL
MySQL 5.6/5.7 DDL 失败残留文件清理指南
通过本文的指南,您可以更安全地处理 MySQL 5.6 和 5.7 版本中 DDL 失败后的残留文件,有效避免数据丢失和数据库不一致的问题。
|
Java 关系型数据库 MySQL
SpringBoot 通过集成 Flink CDC 来实时追踪 MySql 数据变动
通过详细的步骤和示例代码,您可以在 SpringBoot 项目中成功集成 Flink CDC,并实时追踪 MySQL 数据库的变动。
3417 45
|
消息中间件 关系型数据库 MySQL
基于 Flink CDC YAML 的 MySQL 到 Kafka 流式数据集成
本教程展示如何使用Flink CDC YAML快速构建从MySQL到Kafka的流式数据集成作业,涵盖整库同步和表结构变更同步。无需编写Java/Scala代码或安装IDE,所有操作在Flink CDC CLI中完成。首先准备Flink Standalone集群和Docker环境(包括MySQL、Kafka和Zookeeper),然后通过配置YAML文件提交任务,实现数据同步。教程还介绍了路由变更、写入多个分区、输出格式设置及上游表名到下游Topic的映射等功能,并提供详细的命令和示例。最后,包含环境清理步骤以确保资源释放。
1072 2
基于 Flink CDC YAML 的 MySQL 到 Kafka 流式数据集成
|
SQL 监控 关系型数据库
MySQL补充性文件
通过以上内容,您可以全面了解和掌握 MySQL 补充性文件的配置、查看及其作用,从而提升数据库管理的效率和质量。
451 36
|
安全 关系型数据库 MySQL
MySQL8使用物理文件恢复MyISAM表测试
MySQL8使用物理文件恢复MyISAM表测试
276 0
|
监控 关系型数据库 MySQL
Flink CDC MySQL同步MySQL错误记录
在使用Flink CDC同步MySQL数据时,常见的错误包括连接错误、权限错误、表结构变化、数据类型不匹配、主键冲突和
617 17
|
关系型数据库 MySQL 数据库
数据库数据恢复—MYSQL数据库文件损坏的数据恢复案例
mysql数据库文件ibdata1、MYI、MYD损坏。 故障表现:1、数据库无法进行查询等操作;2、使用mysqlcheck和myisamchk无法修复数据库。
|
安全 关系型数据库 MySQL
解决MySQL删除/var/lib/mysql下的所有文件后无法启动的问题
删除 `/var/lib/mysql` 下的所有文件后,需要重新初始化数据目录,确保正确的权限设置,并重新启动 MySQL 服务。通过按照上述步骤操作,可以解决 MySQL 无法启动的问题,并恢复数据库的正常运行。初始化数据目录后,别忘了配置安全设置,并根据需要恢复备份数据。这些步骤不仅能够恢复 MySQL 的正常运行,还能确保数据库的安全性和完整性。
998 2
|
SQL 关系型数据库 MySQL
MySQL导入.sql文件后数据库乱码问题
本文分析了导入.sql文件后数据库备注出现乱码的原因,包括字符集不匹配、备注内容编码问题及MySQL版本或配置问题,并提供了详细的解决步骤,如检查和统一字符集设置、修改客户端连接方式、检查MySQL配置等,确保导入过程顺利。

相关产品

  • 实时计算 Flink版
  • 推荐镜像

    更多