备案控制台

开发者社区问答正文

kafka流与hive表join问题

请问一下，如何保证先加载完hive表，然后再与流join，我发现在hive还没有加载完就已经有join的结果出来，这样刚开始出来的结果是不准确的，还有一个问题是hive表加载完之后不会再做checkpoint？我目前使用的是1.7.1版本，看了1.9的维表join，blink文档说（必须加上FOR SYSTEM_TIME AS OF PROCTIME()，表示JOIN维表当前时刻所看到的每条数据），这也就意味着跟我现在一样，没有加载完hive就会join输出了？*来自志愿者整理的flink邮件归档

展开

收起

小阿怪 2021-12-07 22:03:47 771 版权

版权声明：本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

1 条回答

写回答

取消提交回答

毛毛虫雨

Hi,看了你的问题，主要有两个问题。 1. join hive 维表，没加载完就有 join 输出了。 2. hive 加载完后，就不再做 checkpoint 了。

第一个问题，目前flink 还没有内置支持hive 维表的支持。你可以自己实现一个 udtf 去拉取 hive 数据到内存，udtf 的 eval 方法在加载完 hive 数据之前不返回，这样可以避免没有加载完就有输出的问题。第二个问题，目前 streaming job 中如果存在 finish vertex，是无法做 checkpoint 的。*来自志愿者整理的flink邮件归档

2021-12-08 10:26:33

赞同展开评论

问答分类：

SQL 消息中间件 Kafka HIVE 流计算云消息队列 Kafka 版实时计算 Flink版

问答标签：

Hive join 云消息队列 Kafka 版join Hive表云消息队列 Kafka 版表 kafka Hive

问答地址：

开发者社区 > 大数据 > 问答

相关问答

在Flink CDC中这种方式必须是hive的用户创建的表，创建的hdfs文件才能挂载没有其他方法?

131

0

0

通过spark-sql客户端往hive的一个表随便插入一条数据，然后在hive中查询这个表报错.

340

1

0

通过spark-sql往hive的一个表随便插入一条数据，然后在hive中查询这个表报错

244

0

0

flinksql消费kafka然后look up join doris纬表，出现下面问题怎么解决？

193

1

0

在Flink中将流表数据与Hive维表进行JOIN时，数据是如何被分配到对应subtask的？

136

1

0

在处理流维表JOIN时，面对Hive大维表导致的OOM问题，采取了哪些优化措施？

181

2

0

在Flink CDC中写入kafka，这个默认是根据什么分区的，表的主键吗？

166

1

0

在Flink CDC中消费kafka时如何区分不同record对应是哪个表？

135

1

0

在Flink CDC中整库同步是先将整库的所有表数据同步到一个kafka里吗？

123

1

0

DataWorks离线同步hive插件向导模式报错“获取表列表失败...GET_TABLELI...

161

1

0

问答排行榜

最热

最新

【大咖问答】对话PostgreSQL 中国社区发起人之一，阿里云数据库高级专家德哥

据说在家办公的程序员是这样写代码的？

如何升级配置

【藏经阁一起读（27）】本周推荐《Apache Flink案例集（2022版）》，你有哪些心得？

【精品问答】python技术1000问(1)

运行qwen-image显示Reconnecting

macos 下 lingma 编辑AI 对话栏问题

创业项目：AI 拟人化中层解决方案

阿里云 GPU 如何更换公网 IP？

RTX5060Ti运行Qwen3-VL-8B-Instruct模型速度慢

相关文章

别被“结构化”骗了：聊聊 Spark Structured Streaming 的原理与那些年我踩过的坑

Kafka Streams vs Flink：别再纠结了，选错不是技术问题，是场景没想清楚

我们来说一下 MySQL 的慢查询日志

CI/CD 中的安全闸门：不是“卡人”的流程，而是帮你少背锅的自动化安全测试流水线

数据同步工具选型：DataMover、DataX、Kettle、ETLCloud、Talend、Airbyte

还有其他疑问?