实时计算 Flink版产品使用合集之使用msqlcdc 读数据，五千万数据，想从id三千万开始读取，如何实现-阿里云开发者社区

实时计算 Flink版产品使用合集之使用msqlcdc 读数据，五千万数据，想从id三千万开始读取，如何实现

2024-05-17 172

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： 实时计算Flink版作为一种强大的流处理和批处理统一的计算框架，广泛应用于各种需要实时数据处理和分析的场景。实时计算Flink版通常结合SQL接口、DataStream API、以及与上下游数据源和存储系统的丰富连接器，提供了一套全面的解决方案，以应对各种实时计算需求。其低延迟、高吞吐、容错性强的特点，使其成为众多企业和组织实时数据处理首选的技术平台。以下是实时计算Flink版的一些典型使用合集。

问题一：Flink CDC中msqlcdc 读数据，五千万数据，想从id是三千万那开始读，这可以实现吗？

Flink CDC中msqlcdc 读数据，五千万数据，想从id是三千万那开始读，这可以实现吗？

参考回答：

目前实现不了，

不过可以where 条件进行过滤，5千万数据还好吧，多开点并行度，直线加速冲刺

关于本问题的更多回答可点击原文查看：https://developer.aliyun.com/ask/572202

问题二：flinkcdc全量同步完以后，是从最开始的binlog读的还是从那个binlog读的？

flinkcdc全量同步完以后，同步增量的binlog的时候，是从最开始的binlog读的还是从那个binlog读的？看网上介绍说是从读取全量开始的地方读取的感觉有点不太对，问下确定下的？就是读取binlog的时候对应mysql的文件是哪个时候的binlog文件，现在的一个情况是，我重启任务全量同步然后到增量，然后一直会出现序列化问题，我在想这个binlog读取是从最开始的binlog读取的还是咋回事，有点不太清楚来着

参考回答：

看你用了checkpoint没有，用了的话，从你checkpoint里面的offset开始读，不知道那个binlog文件，你可以指定binlog文件开始读，看看会不会出现你那个问题

关于本问题的更多回答可点击原文查看：https://developer.aliyun.com/ask/572201

问题三：Flink CDC在哪里配置超时时间呐？

Flink CDC在哪里配置超时时间呐？

参考回答：

Flink CDC 提供了一些配置参数来控制连接超时时间。

connection.timeout.ms：用于设置与源数据库之间的连接超时时间。
receive.buffer.bytes：用于设置读取数据缓冲区的大小，以控制 Flink CDC 接收数据的速度。
send.buffer.bytes：用于设置写入数据缓冲区的大小，以控制 Flink CDC 发送数据的速度。

请确保这些参数设置得足够大，以免超时。

此外，您还可以设置 Flink CDC 的 socket timeout，以控制 Flink CDC 与源数据库之间的连接超时时间。

关于本问题的更多回答可点击原文查看：https://developer.aliyun.com/ask/572200

问题四：Flink CDC看到频繁fullgc,目前增加了heartbeat timeout，有什么建议？

Flink CDC看到频繁fullgc,目前增加了heartbeat timeout，在观察中。有没有大佬有什么建议？

参考回答：

高可用搞起来

关于本问题的更多回答可点击原文查看：https://developer.aliyun.com/ask/572199

问题五：Flink CDC使用ds代码方式就是只一个线程读取binlog吗？？

Flink CDC使用ds代码方式就是只一个线程读取binlog吗？？

参考回答：

你需要db.*

关于本问题的更多回答可点击原文查看：https://developer.aliyun.com/ask/571771

相关实践学习

基于Hologres+Flink搭建GitHub实时数据大屏

通过使用Flink、Hologres构建实时数仓，并通过Hologres对接BI分析工具（以DataV为例），实现海量数据实时分析.

实时计算 Flink 实战课程

如何使用实时计算 Flink 搞定数据处理难题？实时计算 Flink 极客训练营产品、技术专家齐上阵，从开源 Flink功能介绍到实时计算 Flink 优势详解，现场实操，5天即可上手！欢迎开通实时计算 Flink 版： https://cn.aliyun.com/product/bigdata/sc Flink Forward Asia 介绍： Flink Forward 是由 Apache 官方授权，Apache Flink Community China 支持的会议，通过参会不仅可以了解到 Flink 社区的最新动态和发展计划，还可以了解到国内外一线大厂围绕 Flink 生态的生产实践经验，是 Flink 开发者和使用者不可错过的盛会。去年经过品牌升级后的 Flink Forward Asia 吸引了超过2000人线下参与，一举成为国内最大的 Apache 顶级项目会议。结合2020年的特殊情况，Flink Forward Asia 2020 将在12月26日以线上峰会的形式与大家见面。