文档备案控制台

开发者社区大数据与机器学习实时计算 Flink 正文

flink sql用做hive维表关联，一共3张hive维表，这块儿有什么问题，应该怎么排查？

大佬们，请教一个问题，flink sql用做hive维表关联，一共3张hive维表，都是left join，其中一张维表因为关联条件不同，处理逻辑不同，先后关联了四次，等于一共6张维表。作业跑起来每时每刻都在丢数据，一天一共12w，跑完一天数据，最后能丢掉一半。

这块儿有什么问题，应该怎么排查？

展开

收起

真的很搞笑 2023-08-28 12:38:45 224 版权

版权声明：本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

1 条回答

写回答

取消提交回答

清风拂袖

Flink SQL 用做 Hive 维表关联，一共 3 张 Hive 维表，可能会出现以下问题：

维表关联配置错误：Flink SQL 中的 Hive 维表关联配置不正确，比如维表地址、端口、用户名、密码不正确。
Hive 表不存在：Hive 表不存在或没有权限访问，会导致 Flink SQL 无法读取 Hive 表数据。
Hive 表数据缺失：Hive 表数据缺失或数据不完整，会导致 Flink SQL 在关联 Hive 表时出现错误。
Hive 表数据异常：Hive 表数据存在脏数据或异常数据，会导致 Flink SQL 在关联 Hive 表时出现错误。
如果遇到 Flink SQL 用做 Hive 维表关联的问题，可以按照以下步骤进行排查：

检查 Flink SQL 中的 Hive 维表关联配置是否正确。
检查 Hive 表是否存在和是否有权限访问。
检查 Hive 表的数据是否完整和是否存在脏数据或异常数据。
如果仍然无法解决问题，可以联系 Flink 官方支持团队寻求帮助。

2023-09-13 14:42:13

赞同展开评论

问答分类：

SQL HIVE 流计算实时计算 Flink版

问答标签：

flink SQL 实时计算 Flink版SQL 实时计算 Flink版排查实时计算 Flink版hive SQL left

问答地址：

开发者社区 > 大数据与机器学习 > 实时计算 Flink > 问答

相关问答

实时计算 Flink版

如果使用flink sql的left join，右表出现部分关联不上的情况，应该怎么处理好？

1138

2

0

Flink CDC有时间帮忙看一下flink sql 多表left join 写入失败的问题嘛？

284

3

0

有没有碰到过实时计算Flink版regular join使用left join后，输出的数据乱序？

355

2

0

Flink CDC left join 5张表每张表都要监听数据变化，都用cdc 会有问题吗？

177

1

0

大佬们，我想请问下，Flink中我是用flinksql进行批处理操作，在left join的时候会？

653

3

0

Flink CDC left join 5张表，都要监听变化数据都用cdc 会有问题吗？

184

1

0

flink sql任务有三个mysql cdc 源表通过left join关联写入目标表，没更新？

614

3

0

请问flink mysql cdc 双流left join后再入库在目标表c没有删除呢？

334

3

0

在Flink中将流表数据与Hive维表进行JOIN时，数据是如何被分配到对应subtask的？

197

1

0

在处理流维表JOIN时，面对Hive大维表导致的OOM问题，采取了哪些优化措施？

264

2

0

大数据与机器学习

实时计算 Flink

实时计算Flink版是阿里云提供的全托管Serverless Flink云服务，基于 Apache Flink 构建的企业级、高性能实时大数据处理系统。提供全托管版 Flink 集群和引擎，提高作业开发运维效率。

我要提问

相关文章

Java在数据库分库分表中间件（ShardingSphere）中的设计

2026年企业如何建设数据系统？四步法：需求梳理→平台选型→数据集成→持续运营

软件开发进阶技能之数据库进阶（五）

AI 时代的数据仓库：阿里云 AnalyticDB MySQL 向量检索 + SQL 分析一体化实战

热门讨论

热门文章

Flink CDC任务从savepoint/checkpoints状态中恢复作业错误问题

flinkcdc在IDEA运行正常，打包就报错

Flink CDC 能适配达梦不？

有用flink cdc同步mysql到hive这样搞过的源码吗?

flink1.19和hive3.1.3，cdc从mysql同步数据到hive，插入时报错？

哪位有编译好的cdc 2.2.0版本能能试用flink 1.14.2的包呀？

在Flink想实时汇总数据，类似数据大屏功能，应该用阿里云Flink的什么功能服务？

如何用实时数据同步打破企业数据孤岛？

Flink CDC2.4.1的版本sqlserver支持指定时间戳消费了吗？

咨询下各位大佬，用Flink CDC 2.2.0同步MYSQL数据库，库表是latin1编码的时候？

展开全部

数据仓库介绍与实时数仓案例

独家专访阿里集团副总裁贾扬清：我为什么选择加入阿里巴巴？

Flume+Kafka+Flink+Redis构建大数据实时处理系统：实时统计网站PV、UV展示

阿里云实时计算产品案例&解决方案汇总

流计算精品翻译: The Dataflow Model

接着！！Apache Flink 全领域干货合集（持续更新）

回顾 | Kafka x Flink Meetup 与世界人工智能大会大数据 AI 专场精彩回顾（附PPT下载）

Flink SQL 功能解密系列 —— 流式 TopN 挑战与实现

Apache Flink 的迁移之路，2 年处理效果提升 5 倍

Flink Checkpoint 问题排查实用指南

展开全部

还有其他疑问?