备案控制台

开发者社区大数据与机器学习实时计算 Flink 正文

Flink这边有个问题 hive中的分桶表通过flink 能帮我们看看么？

Flink这边有个问题 hive中的分桶表通过flink sqlgateway 在k8s容器里处理完 trino去查询这个分桶的算法文件数命名规则等各方不太统一。导致最终使用方trino无法查出来
能帮我们看看么感谢 Hive table 'ro_jp.dwd_itemflow_log_dyy3' is corrupt. File 'part-84a62185-32e5-4c69-9e90-5bf3f581a981-task-0-file-0' does not match the standard naming pattern, and the number of files in the directory (29) does not match the declared bucket count (32) for partition: date=2024-03-31
我改了trino session的一些hive分桶相关的参数没啥用
hive.bucket_execution_enabled
hive.create_empty_bucket_files
hive.parallel_partitioned_bucketed_writes
hive.validate_bucketing
我之前好像在flink文档中看到分桶版本的一些文档了现在无法找到?

展开

收起

真的很搞笑 2024-04-09 07:50:25 73 版权

版权声明：本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

1 条回答

写回答

取消提交回答

芯在这

flink 不支持写 hive 分桶表吧，此回答整理自钉群“【②群】Apache Flink China社区”

2024-04-09 09:47:56

赞同展开评论

问答分类：

流计算 SQL HIVE 算法容器 Kubernetes 容器服务Kubernetes版实时计算 Flink版

问答标签：

实时计算 Flink版hive Hive分桶实时计算 Flink版表 Hive表

问答地址：

开发者社区 > 大数据与机器学习 > 实时计算 Flink > 问答

相关问答

实时计算 Flink版

通过spark-sql客户端往hive的一个表随便插入一条数据，然后在hive中查询这个表报错.

283

1

0

通过spark-sql往hive的一个表随便插入一条数据，然后在hive中查询这个表报错

145

0

0

在处理流维表JOIN时，面对Hive大维表导致的OOM问题，采取了哪些优化措施？

127

2

0

DataWorks离线同步hive插件向导模式报错“获取表列表失败...GET_TABLELI...

100

1

0

机器学习PAI离线有支持emr hive表的计划吗？

107

2

0

机器学习PAI特征平台离线存储目前除了maxcompute外，支持其他类型的存储了吗？比如hive表

119

2

0

OceanBase数据库在表对表insert数据的时候可以像hive那样直接迁移表对应的数据文件吗？

117

1

0

Flink CDC将hive作为source表，为啥总是一提交就结束呢，有人碰到过么？

108

2

0

DataWorks中mongo文档同步到hive 能把多个内嵌文档字段同步到多个hive表吗？

60

1

0

DataWorks中所有CDH hive的表都有问题？

97

2

0

大数据与机器学习

实时计算 Flink

实时计算Flink版是阿里云提供的全托管Serverless Flink云服务，基于 Apache Flink 构建的企业级、高性能实时大数据处理系统。提供全托管版 Flink 集群和引擎，提高作业开发运维效率。

我要提问

相关文章

运动设备靠“数据”卷起来了：跑步机也能比你更懂你？

Java 开发者必看！ArrayList 和 LinkedList 的性能厮杀：选错一次，代码慢成蜗牛

多智能体一致性算法

Coze平台指南（2）：开发环境的搭建与配置

《驾驭云原生复杂性：隐性Bug的全链路防御体系构建》

热门讨论

热门文章

Flink CDC任务从savepoint/checkpoints状态中恢复作业错误问题

flink的1cu是指1cpu还是1cpu+4g存储？

2018spark技术问答集锦，希望能给喜欢spark的同学一些帮助

flink sql 可不可以实现过滤某种操作事件

在斗鱼，实时计算发展的历程如何？

Flink1.17为什么需要JDK 11呢？JDK8我试了也能运行

在Flink CDC中ogg可以做实时同步吗？

Flink-CDC 文档网站地址是什么？

请问下大家有没有遇到过这个错:Caused by: java.lang.ClassNotFoundE

请问如何用flink sql客户端用yarn application模式提交任务呢？

展开全部

超燃！Apache Flink 全球顶级盛会强势来袭

Apache Flink 零基础入门教程（六）：状态管理及容错机制

Flink入坑指南第四章：SQL中的经典操作Group By+Agg

使用Blink SQL+UDAF实现差值聚合计算

Flink 基础详解：大数据处理的强大引擎

从 Flink 到 Doris 的实时数据写入实践 —— 基于 Flink CDC 构建更实时高效的数据集成链路

Flink CDC：新一代实时数据集成框架

Flink SQL 详解：流批一体处理的强大工具

Apache Paimon统一大数据湖存储底座

「48小时极速反馈」阿里云实时计算Flink广招天下英雄

展开全部

还有其他疑问?