文档备案控制台

开发者社区大数据与机器学习实时计算 Flink 正文

Flink CDC 1.17【问题描述】使用JDBC做维表聚合，结果不对？

Flink CDC 1.17【问题描述】使用JDBC做维表聚合，结果不对【问题详情】

展开

收起

真的很搞笑 2023-09-07 10:06:22 173 版权

版权声明：本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

1 条回答

写回答

取消提交回答

哈哈是我

根据您提供的截图和问题描述，您使用 Flink CDC 1.17 在维表聚合中遇到结果不正确的问题。

根据您提供的截图，我注意到您正在使用 Flink 的 JDBCInputFormat 作为维表，并在主数据流中使用了 Flink 的 join 函数来将数据流连接到维表。问题是维表的结果不正确。

有几个可能导致结果不正确的原因：

数据库查询条件不正确：请确保您在 Flink 的 JDBCInputFormat 中设置了正确的查询条件，并且从维表中获得了正确的结果。您可以在数据库中手动运行相同的查询条件，以确认结果是否正确。

数据类型不匹配：确保在 join 操作中，用于连接的字段具有相同的数据类型和格式。如果数据类型不匹配，可能会导致连接失败或结果不正确。

数据倾斜：如果维表的某些键具有非常大的数据量，而其他键的数据量较小，可能会导致数据倾斜。这会影响连接操作的性能和结果。您可以尝试使用 Flink 的 broadcast 或 repartition 等技术来解决数据倾斜问题。

数据库连接问题：请确保您的数据库连接配置正确，数据库连接可用，并且连接池设置合理。连接问题可能会导致无法正确获取维表数据。

请仔细检查以上可能的原因，并逐一排除它们。您还可以尝试使用 Flink 的日志输出来调试问题，以了解具体是哪个环节导致了不正确的结果。

如果问题仍然存在，请提供更多详细的代码和配置信息，以便我能够更准确地帮助您解决问题。

2023-09-20 17:54:50

赞同展开评论

问答分类：

Java 数据库连接流计算实时计算 Flink版

问答标签：

实时计算 Flink版CDC 实时计算 Flink版聚合 flink jdbc jdbc flink 实时计算 Flink版jdbc

问答地址：

开发者社区 > 大数据与机器学习 > 实时计算 Flink > 问答

相关问答

实时计算 Flink版

MaxCompute如何使用JDBC方式获取分区字段和类型的描述

246

1

0

在Flink CDC中flink1.19.1报错如下，是connector版本不对吗？

338

0

0

flink不是自带了jdbc的连接器吗，为什么会提示没有driver？

250

1

0

在Flink CDC中使用jdbc连接器写入mysql，中文变成问号了，要加什么配置吗？

286

1

0

在Flink CDC中模式会默认变化jdbc模式，这样回对holo 的连接数有什么影响吗？

179

1

0

Flink CDC命令这样写不对吗？

208

1

0

在Flink CDC中jdbc sink的sql要提请定义好，能不能根据数据源动态生成？

195

1

0

flink告警通知这边有没有测试功能？测试告警配置的对不对

183

1

0

Flink CDC中jdbc连接器里面如果这个上下界中存在null ，怎么处理呢？

175

1

0

Flink中mongo 的connection 必须指定有什么方法像 jdbc哪种的吗？

240

1

0

大数据与机器学习

实时计算 Flink

实时计算Flink版是阿里云提供的全托管Serverless Flink云服务，基于 Apache Flink 构建的企业级、高性能实时大数据处理系统。提供全托管版 Flink 集群和引擎，提高作业开发运维效率。

我要提问

相关文章

阿里云Qoder CN v1.4.1完整实战指南：Agent式AI编程全流程拆解

专访｜GEO落地工程师罗长才：解析GEO与低时延通信、算网基础设施的协同赋能逻辑

[022][数据模块]基于雪花算法的 MyBatis-Plus 主键生成器设计与实现

微服务网关怎么选：Spring Cloud Gateway vs Higress

热门讨论

热门文章

哪位有编译好的cdc 2.2.0版本能能试用flink 1.14.2的包呀？

Flink CDC任务从savepoint/checkpoints状态中恢复作业错误问题

flinkcdc在IDEA运行正常，打包就报错

有用flink cdc同步mysql到hive这样搞过的源码吗?

Flink CDC 能适配达梦不？

flink1.19和hive3.1.3，cdc从mysql同步数据到hive，插入时报错？

如何用实时数据同步打破企业数据孤岛？

在Flink想实时汇总数据，类似数据大屏功能，应该用阿里云Flink的什么功能服务？

咨询下各位大佬，用Flink CDC 2.2.0同步MYSQL数据库，库表是latin1编码的时候？

Flink CDC全量没问题，增量报错 file is not a valid field name

展开全部

阿里云实时计算产品案例&解决方案汇总

回顾 | Kafka x Flink Meetup 与世界人工智能大会大数据 AI 专场精彩回顾（附PPT下载）

Flink SQL 功能解密系列 —— 流式 TopN 挑战与实现

Flink Checkpoint 问题排查实用指南

史上超强阵容！大数据及人工智能领域顶级盛会，Flink Forward Asia 2019 不容错过！

Flink SQL 功能解密系列 —— 流计算“撤回(Retraction)”案例分析

如何正确使用 Flink Connector？

阿里巴巴高级技术专家章剑锋：大数据发展的 8 个要点

运维场景下的实时计算应用

超燃！Apache Flink 全球顶级盛会强势来袭

展开全部

还有其他疑问?