开发者社区 > 大数据与机器学习 > 实时计算 Flink > 正文

Flink CDC中oracle-cdc上过生产吗?

Flink CDC中oracle-cdc上过生产吗?单表百万,15个表大概,而且还有中间大状态融合和聚合?我并行读老出这个把数据库都弄崩了,我没有去深入研究数据库崩掉是不是这个原因引起的,但是猜测是都是同时发生的?image.png
我并行读老出这个把数据库都弄崩了,我没有去深入研究数据库崩掉是不是这个原因引起的,但是猜测是都是同时发生的?

展开
收起
cuicuicuic 2023-12-05 20:52:59 31 0
1 条回答
写回答
取消 提交回答
  • 面对过去,不要迷离;面对未来,不必彷徨;活在今天,你只要把自己完全展示给别人看。

    Flink CDC在生产环境中实时同步Oracle数据库的案例是可行的,许多用户Flink CDC在生产环境中实时同步Oracle数据库的案例是可行的,许多用户已经在生产环境中使用 Flink CDC 采集和同步 Oracle 数据。具体操作中,需要先确保Oracle中相关表已开启归档日志和补充日志,因为Flink CDC基于Debezium的LogMiner实现,LogMiner需要使用Oracle的归档日志和补充日志来获取变更数据。然后,在Flink程序中创建Oracle CDC连接,通过SQL语句定义同步任务。

    对于你的情况,即单表百万记录,15个表,并且存在中间大状态融合和聚合的问题,需要注意的是,Flink CDC相当于提供了实时物化视图,可以对这些数据做进一步加工,比如清洗、聚合、过滤等。但是,如果并行读取时出现过载现象,可能会导致数据库压力过大甚至崩溃。你提到的情况可能就是由于这个原因引起的。

    因此,你需要对Flink作业进行调整优化,保证并行度适中,避免给数据库带来过大压力。同时,也需要考虑是否可以通过调整数据处理逻辑或者增加资源等方式来解决此问题。例如,采用分批次读取数据,或者对状态进行合理的拆分和合并等策略。

    2023-12-06 14:27:53
    赞同 展开评论 打赏

实时计算Flink版是阿里云提供的全托管Serverless Flink云服务,基于 Apache Flink 构建的企业级、高性能实时大数据处理系统。提供全托管版 Flink 集群和引擎,提高作业开发运维效率。

相关产品

  • 实时计算 Flink版
  • 相关电子书

    更多
    Flink CDC Meetup PPT - 龚中强 立即下载
    Flink CDC Meetup PPT - 王赫 立即下载
    Flink CDC Meetup PPT - 覃立辉 立即下载

    相关镜像