文档备案控制台

开发者社区大数据与机器学习实时计算 Flink 正文

为什么通过spark 写 hudi 同步 hive 设置的主键是通过join写过来的

为什么通过spark 写 hudi 同步 hive 设置的主键是通过join写过来的然后数据进入hudi后通过flink 查询就提示找不到主键此时 spark 查询是正常如果通过单独生成主键比如直接定义一个数值此时 flink是可以查询。做了测试 hudi主键必须是 int 或者 bigint 类型并且不能通过 join的方式传入否则 spark写入进去后 flink 读取立马提示找不到主键不知道大家有没有遇到这个问题的这是约束问题还是？

展开

收起

滴滴滴~ 2023-03-29 17:18:07 563 版权

版权声明：本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

1 条回答

写回答

取消提交回答

回回回123

用cow表试试。此答案整理自钉群“Flink CDC 社区”

2023-03-29 18:06:35

赞同展开评论

问答分类：

SQL 分布式计算 HIVE Spark 流计算实时计算 Flink版

问答标签：

Hive spark apache spark Hive spark Hive Hive join 同步Hive

问答地址：

开发者社区 > 大数据与机器学习 > 实时计算 Flink > 问答

相关问答

实时计算 Flink版

E-MapReduce开启使用DLF统一元数据后本地开发spark程序想访问emr hive中...

184

0

0

有没有用 flink cdc 和spark hudi集成的？

285

0

0

通过spark-sql客户端往hive的一个表随便插入一条数据，然后在hive中查询这个表报错.

478

1

0

大数据计算MaxCompute 执行 Hive Sql 时，用的什么引擎啊，是Spark 吗？

239

1

0

通过spark-sql往hive的一个表随便插入一条数据，然后在hive中查询这个表报错

397

0

0

flink cdc写入hudi的用hive管理元数据的表，这个是什么问题呢？

296

0

0

Flink CDC同步到hudi 可以直接读取hudi 的数据吗例如用hive 或者spark？

276

2

0

spark任务想完整的部署，发布，执行调度，仅仅maxcompute组件权限够么，还需要datawo

1003

1

0

Spark 读取Maxcompute 中的表进行处理，怎么弄？

1079

1

0

maxcompute的底层引擎我用的都是mr，他是可以切换成spark吗？

2095

1

0

大数据与机器学习

实时计算 Flink

实时计算Flink版是阿里云提供的全托管Serverless Flink云服务，基于 Apache Flink 构建的企业级、高性能实时大数据处理系统。提供全托管版 Flink 集群和引擎，提高作业开发运维效率。

我要提问

收录在圈子:

阿里云实时计算Flink

199215

+ 订阅

实时计算 Flink 版（Alibaba Cloud Realtime Compute for Apache Flink，Powered by Ververica）是阿里云基于 Apache Flink 构建的企业级、高性能实时大数据处理系统，由 Apache Flink 创始团队官方出品，拥有全球统一商业化品牌，完全兼容开源 Flink API，提供丰富的企业级增值功能。

相关文章

多模数据库是什么？支持哪些数据模型、能不能用 SQL 查询？阿里云 Lindorm 解析

分布式 JOIN 怎么优化？下推、广播、Co-located JOIN 实战 —— 阿里云 PolarDB-X

让 AI Agent 看见正在发生的业务，阿里云 EventHouse 正式商业化

什么是 HTAP 数据库？一体化行列存实时分析 —— 阿里云 PolarDB-X HTAP 能力解析

分布式数据库分片策略怎么设计？透明分片实践 —— 阿里云 PolarDB-X

热门讨论

热门文章

Flink CDC刚刚写了几条数据，但是里面有点问题，其他字段都是正常的。这是咋回事呀？

Flink CDC任务从savepoint/checkpoints状态中恢复作业错误问题

Flink cdc sqlserver 希望不同步某些数据行

哪位有编译好的cdc 2.2.0版本能能试用flink 1.14.2的包呀？

Segment Key主要应用在哪些场景？

Flink CDC 能适配达梦不？

flinkcdc在IDEA运行正常，打包就报错

有人遇到flink打不开web界面吗？

Flink CDC中，有哪位大佬有flink 版本和cdc版本的适配统计啊？

有用flink cdc同步mysql到hive这样搞过的源码吗?

展开全部

数据仓库介绍与实时数仓案例

通过Flink实时构建搜索引擎的索引

阿里云实时计算产品案例&解决方案汇总

接着！！Apache Flink 全领域干货合集（持续更新）

Flink SQL 功能解密系列 —— 流式 TopN 挑战与实现

Apache Flink 的迁移之路，2 年处理效果提升 5 倍

广告场景下的实时计算

Flink SQL 功能解密系列 —— 流计算“撤回(Retraction)”案例分析

如何正确使用 Flink Connector？

如何在 PyFlink 1.10 中自定义 Python UDF？

展开全部

还有其他疑问?