开发者社区 > 大数据与机器学习 > 实时计算 Flink > 正文

为什么通过spark 写 hudi 同步 hive 设置的主键是 通过join写过来的

为什么通过spark 写 hudi 同步 hive 设置的主键是 通过join写过来的 然后 数据进入hudi后 通过flink 查询 就提示 找不到主键 此时 spark 查询是正常 如果通过 单独生成主键比如 直接定义一个数值 此时 flink是可以查询。做了测试 hudi主键 必须是 int 或者 bigint 类型 并且不能通过 join的方式传入 否则 spark写入进去后 flink 读取 立马提示找不到主键 不知道大家有没有遇到这个问题的 这是 约束问题还是?

展开
收起
滴滴滴~ 2023-03-29 17:18:07 411 0
1 条回答
写回答
取消 提交回答
  • 用cow表试试。 此答案整理自钉群“Flink CDC 社区”

    2023-03-29 18:06:35
    赞同 展开评论 打赏

实时计算Flink版是阿里云提供的全托管Serverless Flink云服务,基于 Apache Flink 构建的企业级、高性能实时大数据处理系统。提供全托管版 Flink 集群和引擎,提高作业开发运维效率。

相关电子书

更多
Hive Bucketing in Apache Spark 立即下载
spark替代HIVE实现ETL作业 立即下载
2019大数据技术公开课第五季—Hive迁移到MaxCompute最佳实践 立即下载