实时计算 Flink版这个是需要将记录集全部读取出来之后再写入目标的么？

实时计算 Flink版source是jdbc-oracle这个是需要将记录集全部读取出来之后再写入目标的么？

展开

收起

真的很搞笑 2024-02-06 08:52:46 98 版权

2 条回答

写回答

取消提交回答

1941623231718325

实时计算Flink版中使用jdbc-oracle作为source时，并不需要一次性将整个Oracle数据库中的记录集全部读取出来再写入目标。相反，通常情况下，我们会利用Flink的流处理能力来连续地从Oracle数据库中读取新的或更新的数据。

当使用Flink的JDBC connector从Oracle数据库读取数据时，它可以配置成以流式的方式从数据库的变化日志（如通过Oracle GoldenGate或LogMiner实现CDC）中获取增量变化，或者按照一定的时间间隔轮询数据库获取最新的数据。

具体而言，如果你配置的是CDC（Change Data Capture），那么Flink会监听Oracle数据库的事务日志，实时捕获新增、修改和删除操作，然后将这些变更事件逐条传递到下游算子或直接写入目标系统。

若采用非CDC方式，则可以通过定期轮询（例如每分钟或每秒查询一次）来获取数据库中变化的数据，但这并不是实时的流处理模式。

因此，关键在于如何配置Flink JDBC source，以便它能够以适合你需求的方式高效地从Oracle数据库中读取实时或近实时的数据变化。

2024-02-20 16:46:21

赞同展开评论
小周sir

面对过去，不要迷离；面对未来，不必彷徨；活在今天，你只要把自己完全展示给别人看。

实时计算 Flink 版不需要将记录集全部读取出来之后再写入目标。

实时计算 Flink 版是一种基于Apache Flink的流处理框架，它支持对数据流进行实时处理和分析。在流处理中，数据是以连续不断的流的形式进入系统的，而系统能够持续不断地对这些数据进行处理，而不是等到所有数据都到达后再开始处理。这意味着实时计算 Flink 版可以对流入的数据进行实时的读取、计算和写入操作，而不是先存储整个数据集再进行处理。

此外，Flink提供了丰富的API来支持各种复杂的数据处理需求，如窗口操作、状态管理和时间处理等。这些特性使得Flink非常适合用于需要低延迟和高吞吐量的实时数据分析场景。

综上所述，实时计算 Flink 版是一个强大的实时数据处理工具，它能够在数据到达时立即进行处理，而不需要等待整个数据集被完全读取。

2024-02-06 16:31:13

赞同展开评论

实时计算 Flink版这个是需要将记录集全部读取出来之后再写入目标的么？

实时计算 Flink

相关文章

热门讨论

热门文章