文档备案控制台

开发者社区大数据与机器学习实时计算 Flink 正文

Flink这边有个问题 hive中的分桶表通过flink 能帮我们看看么？

Flink这边有个问题 hive中的分桶表通过flink sqlgateway 在k8s容器里处理完 trino去查询这个分桶的算法文件数命名规则等各方不太统一。导致最终使用方trino无法查出来
能帮我们看看么感谢 Hive table 'ro_jp.dwd_itemflow_log_dyy3' is corrupt. File 'part-84a62185-32e5-4c69-9e90-5bf3f581a981-task-0-file-0' does not match the standard naming pattern, and the number of files in the directory (29) does not match the declared bucket count (32) for partition: date=2024-03-31
我改了trino session的一些hive分桶相关的参数没啥用
hive.bucket_execution_enabled
hive.create_empty_bucket_files
hive.parallel_partitioned_bucketed_writes
hive.validate_bucketing
我之前好像在flink文档中看到分桶版本的一些文档了现在无法找到?

展开

收起

真的很搞笑 2024-04-09 07:50:25 116 版权

版权声明：本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

1 条回答

写回答

取消提交回答

芯在这

flink 不支持写 hive 分桶表吧，此回答整理自钉群“【②群】Apache Flink China社区”

2024-04-09 09:47:56

赞同展开评论

问答分类：

流计算 SQL HIVE 算法容器 Kubernetes 容器服务Kubernetes版实时计算 Flink版

问答标签：

实时计算 Flink版hive Hive分桶实时计算 Flink版表 Hive表

问答地址：

开发者社区 > 大数据与机器学习 > 实时计算 Flink > 问答

相关问答

实时计算 Flink版

在Flink CDC中这种方式必须是hive的用户创建的表，创建的hdfs文件才能挂载没有其他方法?

135

0

0

通过spark-sql客户端往hive的一个表随便插入一条数据，然后在hive中查询这个表报错.

347

1

0

通过spark-sql往hive的一个表随便插入一条数据，然后在hive中查询这个表报错

254

0

0

大佬们，FlinkSQL1.15版本支持对hive表写入数据读取数据操作吗，环境情况是ambari？

264

2

0

平台上flink sql 写hive表有模版么？

149

3

0

机器学习PAI离线有支持emr hive表的计划吗？

138

2

0

机器学习PAI特征平台离线存储目前除了maxcompute外，支持其他类型的存储了吗？比如hive表

165

2

0

DataWorks中mongo文档同步到hive 能把多个内嵌文档字段同步到多个hive表吗？

75

1

0

dataworks 离线同步任务如何同步 hive表字段类型为 array struct 的数据?

187

1

0

我在类型是hive的iceberg catalog里面建不了CDC的表, 这操作问题吗？

182

1

0

大数据与机器学习

实时计算 Flink

实时计算Flink版是阿里云提供的全托管Serverless Flink云服务，基于 Apache Flink 构建的企业级、高性能实时大数据处理系统。提供全托管版 Flink 集群和引擎，提高作业开发运维效率。

我要提问

相关文章

K8S 部署阿里云 PolarDB-X 集群（企业版、标准版）minikube 教程

阿里云服务器“99计划”是什么？“99计划”云服务器特价及组合套餐讲解

盘点PostgreSQL C语言自定义函数返回数据集的各种方法

线程池：故障梳理总结

Python | Stacking回归和SHAP可解释性分析回归预测及可视化算法

热门讨论

热门文章

Flink CDC任务从savepoint/checkpoints状态中恢复作业错误问题

Flink CDC我想给rocksdb配个存储路径，启动的时候为啥会报不支持相对路径呢？

flink cdc 可以支持达梦数据库么？

Flink CDC有知道Mac m1下的docker 环境如何开启sqlserver代理吗？

Flink1.17为什么需要JDK 11呢？JDK8我试了也能运行

Flink CDC 里生产突然就报这个了，然后，重启任务还是抓不到变动了怎么办？

Flink CDC写 PG，列为数组，为什么？

在Flink CDC中抽取数据凌晨失败了白天重启任务它还从之前零点失败时候的点位开始消费？

有人用flink mysql cdc + doris的吗，怎么捕获入库失败被fliter的数据？

在Flink CDC中Pipeline为什么只有在提交任务的时候才会同步变动的数据不会同步?

展开全部

数据仓库介绍与实时数仓案例

独家专访阿里集团副总裁贾扬清：我为什么选择加入阿里巴巴？

流计算StreamCompute

通过Flink实时构建搜索引擎的索引

Flume+Kafka+Flink+Redis构建大数据实时处理系统：实时统计网站PV、UV展示

阿里云实时计算产品案例&解决方案汇总

Flink SQL 功能解密系列 —— 流式 TopN 挑战与实现

Flink Checkpoint 问题排查实用指南

Flink SQL 功能解密系列 —— 流计算“撤回(Retraction)”案例分析

Flink SQL 功能解密系列 —— 数据去重的技巧和思考

展开全部

还有其他疑问?