备案控制台

开发者社区大数据与机器学习实时计算 Flink 正文

Flink CDC一个库特别多的表目前大家实现采集的时候这种情况是一个库全采集麽?

Flink CDC一个库特别多的表目前大家实现采集的时候一般是如何做架构设计的例如一个库有8000多张表然后又十几个库这种情况是一个库全采集麽 1.下游直接对接kafka？如果是kafka那么update的情况下 join计算大家是如何处理的 2. 还是说用cdc 直接对接Doris 然后基于Doris去实现所有的需求？

展开

收起

真的很搞笑 2023-09-19 08:32:27 99 版权

版权声明：本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

1 条回答

写回答

取消提交回答

清风拂袖

不同的场景下，Flink CDC 的采集方式可能会有所不同。如果一个库特别多的表，通常可以通过以下方法实现采集：

使用一个任务采集整个库。这种方式比较简单，但会导致数据量比较大，可能会导致 Flink 集群的性能瓶颈。
使用多个任务采集整个库。这种方式可以分散数据量，避免数据量太大导致性能瓶颈。但是，需要对任务进行分组和分区，并且需要保证数据的一致性。
使用 Flink CDC 的增量采集功能。这种方式可以通过维护一个元数据表来记录历史数据，从而避免数据重复。但是，需要对元数据表进行维护，并且需要保证元数据表的一致性。
具体选择哪种方式，需要根据实际情况进行评估。

2023-10-19 10:22:11

赞同展开评论

问答分类：

消息中间件 Kafka 流计算实时计算 Flink版云消息队列 Kafka 版

问答标签：

实时计算 Flink版CDC 实时计算 Flink版cdc库实时计算 Flink版库实时计算 Flink版采集实时计算 Flink版cdc采集

问答地址：

开发者社区 > 大数据与机器学习 > 实时计算 Flink > 问答

相关问答

实时计算 Flink版

在Flink CDC中，总是报找不到对应的库表。有人遇到过么？这个方式需要怎么设置了？

106

1

0

在Flink CDC中，flink-cdc做Mysql的整库同步时，有办法忽略掉没有主键的表吗？

143

1

0

在Flink CDC中,多个库，要是ip不一样，是不是不行的？

86

1

0

在Flink CDC中,有多个库需要同步，都是用的配置文件启动任务的?

110

1

0

使用flink-connector-oracle连接器实时采集oracle中的数据？

122

0

0

在Flink CDC中，是不是不支持扩大采集库后从savepoint恢复？

76

1

0

在Flink CDC中，pgsql支持备库嘛？

87

1

0

有两套flink cdc程序分别在国内海外分别采集同一个mysql集群表，请问有什么方法？

76

1

0

对于Flink CDC，这个报错是cdc3.1.0还不支持mysql的列字段名变更功能采集吗

132

1

0

对于Flink CDC，3.x版本的mysql整库同步到doris是可以用代码编写吗？

117

0

0

大数据与机器学习

实时计算 Flink

实时计算Flink版是阿里云提供的全托管Serverless Flink云服务，基于 Apache Flink 构建的企业级、高性能实时大数据处理系统。提供全托管版 Flink 集群和引擎，提高作业开发运维效率。

我要提问

相关文章

缓存与数据库一致性问题的解决策略

SOCKS5代理：通用性与协议覆盖

别等服务器“累瘫了”才想扩容：运维的容量规划，从监控数据说起

简单讲一下有哪些常见的设计模式？

别再“人肉运维”了——聊聊自动化运维平台怎么从0到1搭起来

热门讨论

热门文章

Flink CDC任务从savepoint/checkpoints状态中恢复作业错误问题

Flink1.17为什么需要JDK 11呢？JDK8我试了也能运行

FlinkCDC MySQL 中 scan.startup.mode 用的是什么模式啊？

Flink的tmp的这个目录产生临时文件很大，我想配置到外面，有配置项可以配置吗？

Flink CDC中，有哪位大佬有flink 版本和cdc版本的适配统计啊？

有大佬遇到过flink web ui上的指标都是loading状态吗，flink版本是1.17.1？

Flink有2023 Flink Forward Asia 资料下载地址吗?

Flink CDC里用jdbc往达梦dm8推数据，老是显示字符被截断是咋回事？有人碰到过嘛？

Flink sql将数组炸开，实现hive的explode函数的效果，还有什么其他好的方式？

请问下有实现达梦数据库的 Flink CDC么?

展开全部

数据仓库介绍与实时数仓案例

独家专访阿里集团副总裁贾扬清：我为什么选择加入阿里巴巴？

通过Flink实时构建搜索引擎的索引

Flume+Kafka+Flink+Redis构建大数据实时处理系统：实时统计网站PV、UV展示

阿里云实时计算产品案例&解决方案汇总

回顾 | Kafka x Flink Meetup 与世界人工智能大会大数据 AI 专场精彩回顾（附PPT下载）

Flink SQL 功能解密系列 —— 流式 TopN 挑战与实现

Apache Flink 的迁移之路，2 年处理效果提升 5 倍

基于实时计算（Flink）打造一个简单的实时推荐系统

广告场景下的实时计算

展开全部

还有其他疑问?