有遇到有Flink CDC同步到hudi，hdfs上有文件，hive没有自动建表？

展开

收起

真的很搞笑 2023-11-22 08:14:56 291 版权

3 条回答

写回答

取消提交回答

小周sir

面对过去，不要迷离；面对未来，不必彷徨；活在今天，你只要把自己完全展示给别人看。

有可能会出现 Flink CDC 同步到 Hudi，但 Hive 没有自动建表的情况。
Hive 需要知道表的结构才能正确地创建表。在 Flink CDC 同步数据到 Hudi 时，如果没有提供任何表结构信息，则 Hive 可能无法正确地创建表。在这种情况下，您可以手动创建 Hive 表，并指定其属性和格式（例如，Hive 表应该具有正确的列名、类型和分区等）。
此外，Flink CDC 同步到 Hudi 时需要设置一些额外的参数，例如 hive.metastore.uris 和 hudi.hive.sync.enable 等，以便 Hive 能够检测到 Hudi 表的存在并将其创建为 Hive 表。请参阅相关文档，了解如何设置这些参数。

2023-11-29 14:34:53

赞同展开评论
芯在这

这个和cdc没关系，你去看hudi对应的flink连接器的怎么配置，hudi的catlog怎么用的，此回答整理自钉群“Flink CDC 社区”

2023-11-22 11:24:26

赞同展开评论
sunrr
这可能是由于Hive的元数据同步问题导致的。在Hive中，元数据的变更（如创建表）并不会立即反映到Hive Metastore中，而是需要等待一段时间（称为"synchronization delay"）。这个时间通常取决于Hive Metastore的配置和负载。

你可以尝试以下方法来解决这个问题：
1. 增加Hive Metastore的同步延迟：你可以通过调整Hive配置参数"hive.metastore.synchronize.delay"来增加元数据的同步延迟。但是请注意，增加这个延迟可能会导致Hive查询的性能下降。
2. 手动触发元数据的同步：你可以使用Hive命令"ALTER TABLE ... RECOVER PARTITIONS"来手动触发元数据的同步。
3. 使用Hudi的自动建表功能：Hudi提供了一个名为"AutoCreateTable"的功能，可以在Hudi数据写入时自动创建Hive表。你可以尝试使用这个功能来解决你的问题。
4. 使用Hive的动态分区功能：如果你的Hive表使用了动态分区，那么Hive不会在创建表时预先定义分区列。在这种情况下，Hive可能需要更长的时间来同步元数据。你可以尝试关闭动态分区功能，看看是否可以解决问题。
2023-11-22 09:26:28

赞同展开评论

有遇到有Flink CDC同步到hudi，hdfs上有文件，hive没有自动建表？

实时计算 Flink

相关文章

热门讨论

热门文章