文档备案控制台

开发者社区问答正文

flink消费kafka的数据写入到hdfs中，我采用了BucketingSink 这个sink将o

flink消费kafka的数据写入到hdfs中，我采用了BucketingSink 这个sink将operator出来的数据写入到hdfs文件上，并通过在hive中建外部表来查询这个。但现在有个问题，处于in-progress的文件，hive是无法识别出来该文件中的数据，可我想能在hive中实时查询进来的数据，且不想产生很多的小文件，这个该如何处理呢

展开

收起

黄一刀 2020-04-23 19:32:31 3398 版权

版权声明：本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

1 条回答

写回答

取消提交回答

黄二刀

flink可以自定义文件名字, 这样hive就能读出来了

2020-04-23 19:32:47

赞同展开评论

问答分类：

SQL 消息中间件 Kafka HIVE 流计算实时计算 Flink版云消息队列 Kafka 版

问答标签：

云消息队列 Kafka 版flink 实时计算 Flink版kafka 实时计算 Flink版数据实时计算 Flink版HDFS 文件存储HDFS版数据

问答地址：

开发者社区 > 大数据 > 问答

相关问答

Flink有使用MinIO替换HDFS么？

302

1

0

在Flink CDC中这种方式必须是hive的用户创建的表，创建的hdfs文件才能挂载没有其他方法?

146

0

0

flink 读取oss-hdfs数据问题

212

1

0

在Flink CDC中，怎么没字段 hdfs上文件也是空的？

155

0

0

为什么直接在 Flink 引擎中双写到两个 HDFS 集群不是一个好的选择？

136

1

0

Flink指定chepoint为hdfs路径，启动job报错。有人遇到此问题吗？

166

1

0

Flink报错：是不是必须要指向HDFS的目录？

137

1

0

通过flink sql把数据写入hdfs，如何设置对生产的文件进行压缩？

545

1

0

想问下哪位对Flink 1.16支持的hdfs最高版本是多少？

145

1

0

有大佬知道这是怎么回事么 flink读不到kafka数据

1399

1

0

问答排行榜

最热

最新

【大咖问答】对话PostgreSQL 中国社区发起人之一，阿里云数据库高级专家德哥

据说在家办公的程序员是这样写代码的？

如何升级配置

【藏经阁一起读（27）】本周推荐《Apache Flink案例集（2022版）》，你有哪些心得？

【精品问答】python技术1000问(1)

阿里云如何部署使用OpenClaw？OpenClaw部署一看就会：零基础零代码、纯点击

阿里云ECS 手动部署 OpenClaw 超详细教程（2026最新版）

2026年阿里云新老用户如何部署OpenClaw？OpenClaw部署喂饭级教程

在今天3点左右通义灵码问问题不正常返回了

有没有将一个网页部署到服务器上的教程

相关文章

9B 上端侧：多模态实时对话，难点其实在“流”

Microsoft SQL Server 2025 RTM CU2 (2026 年 2 月累计更新)

Windows Server 2025 中文版、英文版下载 (2026 年 2 月更新)

无需复杂编码：MaxCompute SQL AI 轻松搞定业务难题

Spark SQL练习1-电商用户行为分析

相关解决方案

更多

基于数据闪回，快速恢复数据

分析 Agent 实现一键 AI 数据洞察

多模态数据信息提取

数据守护：防勒索攻击数据保障

高效存储和处理多媒体数据

还有其他疑问?