备案控制台

开发者社区 > 大数据与机器学习 > 实时计算 Flink > 正文

flinkcdc读取binlog后，是直接写入hive，还是先到kafka，写入hive呢？

flinkcdc读取binlog后，是直接写入hive，还是先到kafka，然后hive端消费kafka，写入hive呢？https://mp.weixin.qq.com/s?__biz=MzI1OTM5NDY0Mg==&mid=2247561212&idx=3&sn=dcfaf2b287200a40d728f169808cb727&chksm=ea7a32c1dd0dbbd7dbaa56b38075720d7e8a2833bf1c4d12d5eb9cc97e417e003221e27763b7&scene=27&poc_token=HIv9EGWj6UPQyyo8_EFiJZ0KBodsTeod9Q2-QKA2

展开

收起

真的很搞笑 2023-10-02 14:17:26 125 0

2 条回答

写回答

取消提交回答

街头艺术家

FlinkCDC读取binlog后，通常会先写入Kafka，然后再写入Hive。这是因为Kafka是一个高吞吐量的分布式消息队列，可以提供高效的数据传输和处理。通过将数据先写入Kafka，可以降低FlinkCDC的压力，提高数据处理的性能和稳定性。此外，Kafka还提供了强大的数据流处理能力，可以方便地进行数据清洗、转换和聚合操作，从而进一步提高数据的质量和一致性。

2023-10-12 17:01:57

赞同展开评论打赏
芯在这

现在应该定义一下catalog, 直接写hive, 很久之前, 试过写hdfs目录, 反正hive元数据就是映射的hdfs路径, 定时flush, 然后hive表就能查到数据了，此回答整理自钉群“Flink CDC 社区”

2023-10-04 07:39:54

赞同展开评论打赏

问答分类：

SQL 消息中间件 Kafka HIVE 云消息队列 Kafka 版实时计算 Flink版

问答标签：

flinkcdc binlog flinkcdc云消息队列 Kafka 版云消息队列 Kafka 版flinkcdc binlog flinkcdc binlog kafka

问答地址：

开发者社区 > 大数据与机器学习 > 实时计算 Flink > 问答

版权声明：本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

相关问答

实时计算 Flink版

flinkcdc支持任务起动后不重启的情况下mysql source能捕获新建表的binlog吗?

66

1

0

FlinkCDC监听Mysql binlog，建立链接不会释放

38

0

0

为什么使用FlinkCDC和Kakfa Sink向Kakfa中发送binlog数据，会存在脏数据？

72

0

0

FLinkcdc 在初始化快照阶段的时候是不是就会记录下binlog点位？

47

1

0

使用flinkcdc 3.1.1 同步mysql到kafka，改表结构之后就不能从特定位置起了吗？

43

1

0

flinkcdc同步oracle到kafka刚开始加了那两个参数可以秒级监控，有经验知道怎么排查吗？

45

0

0

flinkcdc 采集mysql出现卡在某个binlog文件出不来怎么办？

47

0

0

flinkcdc在监听binlog时如果程序停掉，中途又新增，如何让程序在停掉的点重新监听？

196

9

0

flinkcdc在监听binlog的时候如果程序停掉了，如何能让程序在停掉的那个点重新监听呢？

51

1

0

各位，Flink 的离线计算的数据是怎么存放的？是存在 HDFS（或Hive）上的吗？

1672

6

0

大数据与机器学习

实时计算 Flink

实时计算Flink版是阿里云提供的全托管Serverless Flink云服务，基于 Apache Flink 构建的企业级、高性能实时大数据处理系统。提供全托管版 Flink 集群和引擎，提高作业开发运维效率。

我要提问

热门讨论

热门文章

有个关于scan.startup.mode的配置问题想问下

FlinkCDC MySQL 中 scan.startup.mode 用的是什么模式啊？

Flink sql将数组炸开，实现hive的explode函数的效果，还有什么其他好的方式？

Flink如何配置Task Manager？

请问如何用flink sql客户端用yarn application模式提交任务呢？

Flink这个未授权访问漏洞有什么解决方案吗？

Flink 集群重启后，所有的Jobs任务全都没有了。如果快速恢复所有的任务

使用flink on yarn的模式，怎么进行内存资源调优呢，如何配置flink内存

flink实时写HDFS时遇到Slow ReadProcessor read fields took

flinksql 可以设置自增id 吗？

展开全部

数据仓库介绍与实时数仓案例

独家专访阿里集团副总裁贾扬清：我为什么选择加入阿里巴巴？

Flink SQL 功能解密系列 —— 维表 JOIN 与异步优化

Flume+Kafka+Flink+Redis构建大数据实时处理系统：实时统计网站PV、UV展示

阿里云实时计算产品案例&解决方案汇总

为什么说流处理即未来？

基于实时计算（Flink）打造一个简单的实时推荐系统

广告场景下的实时计算

史上超强阵容！大数据及人工智能领域顶级盛会，Flink Forward Asia 2019 不容错过！

基于Flink的实时日志分析系统实践

展开全部

相关课程

更多

消息队列Kafka入门课程

3492

4

去学习

分布式消息系统 Kafka 快速入门

984

24

去学习

大数据Hive教程精讲

1024

25

去学习

相关电子书

更多

Java Spring Boot开发实战系列课程【第16讲】：Spring Boot 2.0 实战Apache Kafka百万级高并发消息中间件与原理解析 立即下载

MaxCompute技术公开课第四季之如何将Kafka数据同步至MaxCompute 立即下载

消息队列kafka介绍 立即下载