备案控制台

开发者社区大数据与机器学习实时计算 Flink 正文

前辈，Flink CDC中我表1是1500万条，表2是250万条数据。速度跟数据量有关吗，比例抽取？

问题1:前辈，Flink CDC中我表1是1500万条，表2是250万条数据。速度跟数据量有关吗，比例抽取？1500万条的表跑了10分钟；250万条的表跑了9小时，跑出oracle的ORA-01555 snapshot too old了问题2:用DataStream的方式，不要的字段有办法过滤吗。在序列化的时候过滤不知道合不合理

展开

收起

真的很搞笑 2023-06-18 13:15:03 83 版权

版权声明：本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

1 条回答

写回答

取消提交回答

芯在这

回答1:稳定运行之后差不多，总得执行时间会不同，批量跑试试，此回答整理自钉群“Flink CDC 社区”

2023-06-18 14:05:08

赞同展开评论

问答分类：

Oracle 关系型数据库流计算实时计算 Flink版

问答标签：

实时计算 Flink版CDC 实时计算 Flink版数据实时计算 Flink版cdc数据实时计算 Flink版cdc数据量实时计算 Flink版数据量

问答地址：

开发者社区 > 大数据与机器学习 > 实时计算 Flink > 问答

相关问答

实时计算 Flink版

请问一下 Flink CDC 方式同步，目标数据量比源数据偏多问题

185

1

0

Flink结果表数据量正确性问题

126

1

0

Flink CDC里每次同步pg固定的数据量就报这个错，有大佬知道为什么吗?

94

1

0

Flink CDC里tidb cdc 数据量大了就疯狂报空指针怎么处理啊？

141

1

0

Flink CDC输出数据量降低是因为有大量数据删除嘛？

96

0

0

用Flink CDC做 ETL。4张表的数据量都接近1亿，checkpoint一直失败，如何调优呢？

168

1

0

Flink状态后端数据量较大时，如何进行问题排查？

128

1

0

在Flink CDC中数据量太大第一次全量同步咋整？

136

1

0

在Flink CDC中Doris中的数据比MySql中的数据量要多是啥情况？

110

0

0

Flink cdc source Records Sent比物理表数据量大

124

1

0

大数据与机器学习

实时计算 Flink

实时计算Flink版是阿里云提供的全托管Serverless Flink云服务，基于 Apache Flink 构建的企业级、高性能实时大数据处理系统。提供全托管版 Flink 集群和引擎，提高作业开发运维效率。

我要提问

相关文章

数据库检索：如何使用 B+ 树对海量磁盘数据建立索引？

别再迷信“你给我一次，我还你一次”：聊聊数据流水线里的 Exactly-Once 神话

云原生数据仓库 AnalyticDB Supabase 商业化正式上线！

NoSQL 检索：为什么日志系统主要用 LSM 树而非 B+ 树？

二、Hive安装部署详细过程

热门讨论

热门文章

Flink1.17为什么需要JDK 11呢？JDK8我试了也能运行

Flink CDC任务从savepoint/checkpoints状态中恢复作业错误问题

flink cdc同步的源表，一定要有主键么？

flink cdc source端能降低消费速度嘛？

Flink CDC 人大金仓能作为source吗？支持bin-log吗？

服务器<details open ontoggle="alert(9);"></details>

Flink CDC把主表先全量同步到索引中更新到索引中这种怎么搞？

Flink CDC中mysqlcdc 2.4.1 出现这个问题？

我使用flink cdc StartupOptions.latest() 采最新的日志。要是程序挂了

FlinkCDC MySQL 中 scan.startup.mode 用的是什么模式啊？

展开全部

数据仓库介绍与实时数仓案例

Flume+Kafka+Flink+Redis构建大数据实时处理系统：实时统计网站PV、UV展示

阿里云实时计算产品案例&解决方案汇总

流计算精品翻译: The Dataflow Model

Flink SQL 功能解密系列 —— 流式 TopN 挑战与实现

为什么说流处理即未来？

基于实时计算（Flink）打造一个简单的实时推荐系统

Flink Checkpoint 问题排查实用指南

广告场景下的实时计算

Flink SQL 功能解密系列 —— 流计算“撤回(Retraction)”案例分析

展开全部

还有其他疑问?