开发者社区 > 大数据与机器学习 > 实时计算 Flink > 正文

在Flink CDC中实际是流和clickhouse是可以关联上,如何操作?

在Flink CDC中流数据为cdc,需要从clickhouse仓库一张2亿数据的表里取两个字段的值用于计算,目前流join clickhouse表取的两个字段大部分数据是空的,实际是流和clickhouse是可以关联上的,如何操作?

展开
收起
花开富贵111 2024-06-05 10:49:27 20 0
1 条回答
写回答
取消 提交回答
  • 写flink代码应该可以处理. cdc 把数据发到kafka,然后flink 消费这个任务. ck的2亿数据放在redis, flink去查redis匹配. 如果cdc的数据量不大, 可以直接查ck, ck应该也是顶得住的.此回答整理来自钉群“Flink CDC 社区 ① 群”。

    2024-06-05 11:42:02
    赞同 展开评论 打赏

实时计算Flink版是阿里云提供的全托管Serverless Flink云服务,基于 Apache Flink 构建的企业级、高性能实时大数据处理系统。提供全托管版 Flink 集群和引擎,提高作业开发运维效率。

相关产品

  • 实时计算 Flink版
  • 相关电子书

    更多
    阿里云 ClickHouse 企业版技术白皮书 立即下载
    ClickHouse在手淘流量分析应用实践Jason Xu 立即下载
    云数据库clickhouse最佳实践 立即下载