Flink CDC中关于维表join这种情况下flinksql咋写呢？

Flink CDC中关于维表join，假如我的动态表是A，我要补充的数据在表C，但是两者需要通过表B才能关联起来，这种情况下flinksql咋写呢？lookup join。

动态表A，要取的补充字段在表C，表A和表C需要表B才能关联上，这种属于多流join?

展开

收起

十一0204 2023-07-26 07:35:39 495 版权

3 条回答

写回答

取消提交回答

Star时光
在 Flink CDC 中，使用 Flink SQL 进行维表 join 是非常方便和直观的。下面是一个示例的 Flink SQL 查询语句，展示了如何进行维表 join：
```
SELECT t1.*, t2.column_name
FROM table1 AS t1
LEFT JOIN table2 FOR SYSTEM_TIME AS OF t1.proctime AS t2
ON t1.key = t2.key
```
上述查询中，假设 table1 和 table2 分别是你的主表和维表。通过 FOR SYSTEM_TIME AS OF 子句，我们可以指定在主表的处理时间（t1.proctime）范围内从维表获取数据。key 是主表和维表之间的关联字段。

这个查询将返回主表 table1 的所有列以及维表 table2 的 column_name 列。如果某条主表记录在维表中找不到匹配的记录，对应的 column_name 值将为 null。

请根据你的实际情况进行相应的调整：
- 将 table1 和 table2 替换为你的实际表名。
- 根据实际情况修改关联字段的名称和条件 (ON 子句)。
- 根据需要选择返回的列。
这个示例只是一个简单的维表 join 查询，你可以根据具体的业务需求进行更复杂的查询和转换操作。

确保正确配置 Flink CDC 连接器，并在 Flink SQL 中注册所需的表后，你可以使用类似上述示例的 Flink SQL 查询语句来进行维表 join 操作。
2023-07-31 23:28:49

赞同展开评论
算精通

北京阿里云ACE会长

骤进行操作：
定义 A 表和 C 表的 Schema：首先需要定义 A 表和 C 表的 Schema，包括字段名、字段类型等信息。可以通过类似如下的 SQL 语句定义：
scheme
Copy
CREATE TABLE A (
id INT,
name STRING,
...
) WITH (
'connector.type' = 'jdbc',
'connector.url' = 'jdbc:mysql://localhost:3306/db',
'connector.table' = 'A',
...
);

CREATE TABLE C (
id INT,
value STRING,
...
) WITH (
'connector.type' = 'jdbc',
'connector.url' = 'jdbc:mysql://localhost:3306/db',
'connector.table' = 'C',
...
);
定义 B 表的 Schema 并注册为 Lookup Table：接下来需要定义 B 表的 Schema，并将其注册为 Lookup Table。可以通过类似如下的 SQL 语句定义：
scheme
Copy
CREATE TABLE B (
id INT,
a_id INT,
c_id INT,
...
) WITH (
'connector.type' = 'jdbc',
'connector.url' = 'jdbc:mysql://localhost:3306/db',
'connector.table' = 'B',
...
);

CREATE TABLE Lookup_B (
id INT,
a_id INT,
cid INT,
...
) WITH (
'connector.type' = 'jdbc',
'connector.url' = 'jdbc:mysql://localhost:3306/db',
'connector.table' = 'B',
...
'lookup.cache.max-rows' = '1000', -- 可选配置，用于控制 Lookup Table 的缓存大小
'lookup.cache.ttl' = '10s' -- 可选配置，用于控制 Lookup Table 的缓存过期时间
);
注意，在定义 Lookup Table 时需要将其命名为 Lookup 开头，以便 Flink SQL 将其识别为 Lookup Table。
使用 Lookup Join 进行关联：最后可以使用 Lookup Join 将 A

2023-07-29 16:54:15

赞同展开评论
意中人jswy

意中人就是我呀！

嵌套一层 (A join B ) join C，On里面的关联条件用主键关联试试。cdc都是流的方式，i和b表你因该是jdbc维表的方式，如果用cdc的方式，三张表每张表刷数据都会引发你的计算。按照维表查询的场景，应该是o表有数据更新你才需要计算，多流join，你的数据在状态ttl内会越来越大，超过tll的数据可能丢数据，是的，i和b表你应该有jdbc维表的方式。此回答整理至钉群“Flink CDC 社区”。

2023-07-26 12:04:00

赞同展开评论

Flink CDC中关于维表join这种情况下flinksql咋写呢？

实时计算 Flink

相关文章

热门讨论

热门文章

Flink CDC中关于维表join这种情况下flinksql咋写呢 ？

实时计算 Flink

相关文章

热门讨论

热门文章

Flink CDC中关于维表join这种情况下flinksql咋写呢？