这个Flink问题怎么解决?

这个Flink问题怎么解决?实时数仓构建过程中,用flink sql将数据实时采集到ods(doris unique模型)后,又怎么将ods数据加工后放到dwd(doris unique模型)层宽表中呢?ods层数据涉及到的更新/删除也要体现在dwd和dws(doris 聚合模型)层中,请问是不是要借助外部的任务调度工具(如海豚调度)完成层与层的数据构建呢image.png

展开
收起
三分钟热度的鱼 2023-09-27 19:30:56 178 分享 版权
1 条回答
写回答
取消 提交回答
  • 你好,你可以使用 Flink CDC 从 Doris 中消费数据,然后再将数据写入到另一张 Doris 表中。

    具体的操作如下:

    创建一个 Flink CDC 任务,并配置好连接 Doris 的参数。
    在 CDC 任务中定义一个转换函数,将输入的数据转换成你想要的数据格式。
    将转换后的数据写入到另一张 Doris 表中。
    如果需要对数据进行更新/删除,你可以使用 Flink SQL 中的 MERGE 语句。

    具体语法如下:

    MERGE INTO table_name AS target
    USING source_table AS source
    ON target.key = source.key
    WHEN MATCHED THEN
    UPDATE SET ...
    WHEN NOT MATCHED THEN
    INSERT ...
    其中:

    table_name 是目标表的名称。
    key 是连接源表和目标表的键列。
    source_table 是源表的名称。
    ... 是更新目标表的列名和更新值。
    如果需要使用外部任务调度工具来完成层与层的数据构建,你可以使用 Apache DolphinScheduler。

    具体的操作如下:

    创建一个 Apache DolphinScheduler 作业,并配置好连接 Doris 的参数。
    在作业中定义一个 Flink SQL 作业,并使用 Flink CDC 从 Doris 中消费数据。
    将 Flink SQL 作业写入到另一张 Doris 表中。
    以上就是关于如何使用 Flink CDC 从 Doris 中消费数据并将数据写入到另一张 Doris 表中的示例。

    2023-10-12 14:49:52
    赞同 展开评论

实时计算Flink版是阿里云提供的全托管Serverless Flink云服务,基于 Apache Flink 构建的企业级、高性能实时大数据处理系统。提供全托管版 Flink 集群和引擎,提高作业开发运维效率。

还有其他疑问?
咨询AI助理