实时计算 Flink版产品使用问题之在online模式下增量抓取Oracle数据时,在archive_log切换时,出现数据丢失的情况,是什么原因

本文涉及的产品
实时计算 Flink 版,5000CU*H 3个月
简介: 实时计算Flink版作为一种强大的流处理和批处理统一的计算框架,广泛应用于各种需要实时数据处理和分析的场景。实时计算Flink版通常结合SQL接口、DataStream API、以及与上下游数据源和存储系统的丰富连接器,提供了一套全面的解决方案,以应对各种实时计算需求。其低延迟、高吞吐、容错性强的特点,使其成为众多企业和组织实时数据处理首选的技术平台。以下是实时计算Flink版的一些典型使用合集。

问题一:flink1.17.1 cdc 2.4.2也有这个问题呢?

flink1.17.1 cdc 2.4.2也有这个问题呢?cdc拿到数据后,时间少了两个00



参考答案:

你可以自定义下debezium的Converter.



关于本问题的更多回答可点击进行查看:

https://developer.aliyun.com/ask/587184



问题二:flinkcdc目前用的是 flinkcdc 2.2.1 , 在哪个版本有修复个问题呢?

今天发现个问题,1 在数据库里的update_time='2024-01-04 11:00:12.200' flinkcdc拿到数据发给kafka的是 2024-01-04 11:00:12.2 它把最后两个00去掉了,目前用的是 flinkcdc 2.2.1 , 在哪个版本有修复个问题呢?



参考答案:

现在已经到3.0 了 可以去官网看看升级点 介绍



关于本问题的更多回答可点击进行查看:

https://developer.aliyun.com/ask/587181



问题三:Flink CDC2.4用online模式增量抓取oracle数据有数据丢失,有了解这个情况的吗?

Flink CDC2.4用online模式增量抓取oracle数据有数据丢失,跟踪采集过程,发现如果是在archive_log切换的时候。有了解这个情况的吗?



参考答案:

Flink CDC 2.4在online模式下增量抓取Oracle数据时,如果在archive_log切换的时候可能会出现数据丢失的情况。这可能是因为Flink CDC无法正确处理归档日志的切换导致的。

要解决这个问题,你可以尝试以下方法:

  1. 确保你的Flink CDC作业配置正确,包括数据库连接信息、日志读取位置等。
  2. 检查Oracle数据库的归档日志设置,确保归档日志的切换不会中断数据的连续性。你可以调整归档日志的切换策略或增加归档日志保留时间来减少切换的频率。
  3. 如果可能的话,尝试使用Flink CDC的其他模式,如incremental模式或complete模式,以获取更稳定的数据抓取结果。
  4. 如果问题仍然存在,建议向Flink社区或相关技术支持渠道寻求帮助,提供详细的错误日志和配置信息,以便他们能够更好地帮助你解决问题。



关于本问题的更多回答可点击进行查看:

https://developer.aliyun.com/ask/587179



问题四:Flink CDC 3.0支持mysql到es或者doris到es吗?

Flink CDC 3.0支持mysql到es或者doris到es吗?



参考答案:

还没支持,现在只有这俩



关于本问题的更多回答可点击进行查看:

https://developer.aliyun.com/ask/587178



问题五:我的Flink CDC的jobmanager内存总是持续升高直到宕机,这个是什么原因呀?

我的Flink CDC的jobmanager内存总是持续升高直到宕机,这个是什么原因呀,有解决思路么?



参考答案:

Flink CDC的jobmanager内存持续升高直到宕机可能是由于以下原因之一:

  1. 数据量过大:如果处理的数据量非常大,可能会导致jobmanager内存不足。可以尝试增加jobmanager的内存大小或者优化数据处理逻辑以减少内存占用。
  2. 反压机制问题:当处理速度跟不上数据产生速度时,可能会出现反压机制导致内存持续升高。可以检查反压机制的配置是否正确,并尝试调整相关参数以解决该问题。
  3. 资源竞争:如果有其他任务或应用程序与Flink CDC jobmanager竞争内存资源,也可能导致内存持续升高。可以尝试减少其他任务的资源占用或者增加jobmanager的内存分配。
  4. 内存泄漏:可能存在内存泄漏的情况,导致内存无法释放。可以使用内存分析工具来定位和修复内存泄漏问题。

综上所述,需要进一步分析和调试才能确定具体的原因,并采取相应的措施来解决该问题。



关于本问题的更多回答可点击进行查看:

https://developer.aliyun.com/ask/587177

相关实践学习
基于Hologres轻松玩转一站式实时仓库
本场景介绍如何利用阿里云MaxCompute、实时计算Flink和交互式分析服务Hologres开发离线、实时数据融合分析的数据大屏应用。
Linux入门到精通
本套课程是从入门开始的Linux学习课程,适合初学者阅读。由浅入深案例丰富,通俗易懂。主要涉及基础的系统操作以及工作中常用的各种服务软件的应用、部署和优化。即使是零基础的学员,只要能够坚持把所有章节都学完,也一定会受益匪浅。
相关文章
|
23天前
|
数据采集 监控 Oracle
实时计算 Flink版产品使用问题之如何从Oracle物理备用库中进行实时数据抽取
实时计算Flink版作为一种强大的流处理和批处理统一的计算框架,广泛应用于各种需要实时数据处理和分析的场景。实时计算Flink版通常结合SQL接口、DataStream API、以及与上下游数据源和存储系统的丰富连接器,提供了一套全面的解决方案,以应对各种实时计算需求。其低延迟、高吞吐、容错性强的特点,使其成为众多企业和组织实时数据处理首选的技术平台。以下是实时计算Flink版的一些典型使用合集。
|
23天前
|
SQL 消息中间件 Kafka
实时计算 Flink版产品使用问题之如何在EMR-Flink的Flink SOL中针对source表单独设置并行度
实时计算Flink版作为一种强大的流处理和批处理统一的计算框架,广泛应用于各种需要实时数据处理和分析的场景。实时计算Flink版通常结合SQL接口、DataStream API、以及与上下游数据源和存储系统的丰富连接器,提供了一套全面的解决方案,以应对各种实时计算需求。其低延迟、高吞吐、容错性强的特点,使其成为众多企业和组织实时数据处理首选的技术平台。以下是实时计算Flink版的一些典型使用合集。
|
7天前
|
Ubuntu Oracle 关系型数据库
Oracle VM VirtualBox之Ubuntu 22.04LTS双网卡网络模式配置
这篇文章是关于如何在Oracle VM VirtualBox中配置Ubuntu 22.04LTS虚拟机双网卡网络模式的详细指南,包括VirtualBox网络概述、双网卡网络模式的配置步骤以及Ubuntu系统网络配置。
31 3
|
17天前
|
消息中间件 监控 Kafka
联通实时计算平台问题之Flink状态后端数据量较大时,问题排查要如何进行
联通实时计算平台问题之Flink状态后端数据量较大时,问题排查要如何进行
|
13天前
|
SQL Oracle 关系型数据库
实时计算 Flink版产品使用问题之Oracle数据库是集群部署的,怎么进行数据同步
实时计算Flink版作为一种强大的流处理和批处理统一的计算框架,广泛应用于各种需要实时数据处理和分析的场景。实时计算Flink版通常结合SQL接口、DataStream API、以及与上下游数据源和存储系统的丰富连接器,提供了一套全面的解决方案,以应对各种实时计算需求。其低延迟、高吞吐、容错性强的特点,使其成为众多企业和组织实时数据处理首选的技术平台。以下是实时计算Flink版的一些典型使用合集。
|
16天前
|
缓存 流计算
美团 Flink 大作业部署问题之根据已存在的 Checkpoint 副本进行增量的副本制作如何实现
美团 Flink 大作业部署问题之根据已存在的 Checkpoint 副本进行增量的副本制作如何实现
|
16天前
|
流计算 索引
美团 Flink 大作业部署问题之RocksDBStateBackend 的增量 Checkpoint 要怎么制作
美团 Flink 大作业部署问题之RocksDBStateBackend 的增量 Checkpoint 要怎么制作
|
19天前
|
SQL 监控 Oracle
Oracle数据误删不用怕,跟我来学日志挖掘
Oracle数据误删不用怕,跟我来学日志挖掘
17 0
|
23天前
|
SQL Oracle Java
实时计算 Flink版产品使用问题之采集Oracle数据时,为什么无法采集到其他TABLESPACE的表
实时计算Flink版作为一种强大的流处理和批处理统一的计算框架,广泛应用于各种需要实时数据处理和分析的场景。实时计算Flink版通常结合SQL接口、DataStream API、以及与上下游数据源和存储系统的丰富连接器,提供了一套全面的解决方案,以应对各种实时计算需求。其低延迟、高吞吐、容错性强的特点,使其成为众多企业和组织实时数据处理首选的技术平台。以下是实时计算Flink版的一些典型使用合集。
|
23天前
|
分布式计算 Oracle 关系型数据库
实时计算 Flink版产品使用问题之获取Oracle的数据时无法获取clob类型的数据,该怎么办
实时计算Flink版作为一种强大的流处理和批处理统一的计算框架,广泛应用于各种需要实时数据处理和分析的场景。实时计算Flink版通常结合SQL接口、DataStream API、以及与上下游数据源和存储系统的丰富连接器,提供了一套全面的解决方案,以应对各种实时计算需求。其低延迟、高吞吐、容错性强的特点,使其成为众多企业和组织实时数据处理首选的技术平台。以下是实时计算Flink版的一些典型使用合集。

相关产品

  • 实时计算 Flink版
  • 推荐镜像

    更多