一个表既是源表又是维表，flink是怎么读取啊？

展开

收起

真的很搞笑 2023-11-21 08:11:50 201 版权

3 条回答

写回答

取消提交回答

芯在这

直接用触发器不就好了，此回答整理自钉群“【③群】Apache Flink China社区”

2023-11-21 22:26:49

赞同展开评论
小周sir

面对过去，不要迷离；面对未来，不必彷徨；活在今天，你只要把自己完全展示给别人看。
Apache Flink 可以从多个数据源读取数据，包括源表和维表。为了实现这一点，你可以在一个 Flink SQL 查询中指定多个表源，并通过 JOIN 或 UNION 等操作符将它们连接在一起。
如果你的一个表既是源表又是维表，则需要将其添加两次到你的查询中，一次作为源表，另一次作为维表。例如：
```
SELECT ... FROM source_table AS s
JOIN (
    SELECT ... FROM dimension_table
) AS d ON ...
```
在这个例子中，《source_table》是源表，同时也是维表，因此需要加入两次查询，一次作为源表，另一次作为维表。
需要注意的是，Flink SQL 支持多种类型的维表，包括静态维表和动态维表。静态维表是一次性加载到内存中的维表，而动态维表则可以通过实时流的方式动态更新。这两种类型的维表都可以通过不同的方式定义，并且可以在同一个查询中混合使用。
2023-11-21 14:03:30

赞同展开评论
sunrr
在Flink中，如果一个表既是源表又是维表，那么你需要创建两个不同的DataStream对象来分别处理。
1. 对于源表，你可以使用ExecutionEnvironment.getExecutionEnvironment().fromSource(sourceTable, sourceTypeInfo, sourceSchema)来创建一个DataStream对象。
2. 对于维表，你可以使用ExecutionEnvironment.getExecutionEnvironment().fromCollection(lookupTable)来创建一个DataStream对象。
然后，你可以使用这两个DataStream对象来构建你的Flink程序。在处理过程中，你需要确保源表和维表的键是相同的，以便于你在Join操作中进行正确的匹配。

注意，这种方法只适用于静态的数据，即在你开始运行Flink程序之前，源表和维表的内容都是固定的。如果你需要处理动态的数据，那么你可能需要使用其他的机制，例如使用Kafka作为源表和维表，然后在Join操作中使用Kafka Connector来进行数据的匹配。
2023-11-21 09:16:56

赞同展开评论

一个表既是源表又是维表，flink是怎么读取啊？

实时计算 Flink

相关文章

热门讨论

热门文章