文档备案控制台

开发者社区问答正文

Flink实时写入hive异常怎么办？

流写入hive，其实是属于数据湖的概念范畴。因为流往hive里面写，会造成很多的碎片文件，对hdfs造成性能影响，因此一般不会在流场景下直接写入hive。详细的可以了解 Delta lake 或 hudi。

在2020年04月1日 15:05，sunfulinsu...@163.com 写道： Hi，场景其实很简单，就是通过Flink实时将kafka数据做个同步到hive。hive里创建了分区表。我感觉这个场景很常见吧。之前以为是支持的，毕竟可以在通过hivecatalog创建kafka table。但是创建了不能写，有点不合理。 OK吧。想问下FLIP-115计划是在哪个release版本支持哈？1.11么？*来自志愿者整理的FLINK邮件归档

展开

收起

玛丽莲梦嘉 2021-12-03 18:42:10 1732 版权

版权声明：本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

1 条回答

写回答

取消提交回答

CCCC

虽然数据湖可以扩展一些事情，但是流写Hive也是Hive数仓重要的一环。

文件数的问题： - 取决于checkpoint间隔，如果checkpoint间隔内，能写到128MB的文件，对HDFS来说就是很合适的文件大小了。 - 流写，也可以引入files compact等功能，FLIP-115里面也有讨论。*来自志愿者整理的FLINK邮件归档

2021-12-03 19:04:04

赞同展开评论

问答分类：

SQL 消息中间件 Kafka HIVE 流计算实时计算 Flink版云消息队列 Kafka 版

问答标签：

实时计算 Flink版hive 实时计算 Flink版异常实时计算 Flink版异常怎么办 Hive异常实时计算 Flink版hive异常

问答地址：

开发者社区 > 大数据 > 问答

相关问答

Flink CDC里这个报错怎么办？

128

1

0

实时计算Flink作业异常重启

137

1

0

Flink 集群异常自愈服务是如何工作的？

127

1

0

在Flink CDC中作业异常以后，会自动从检查点恢复作业，但是为什么一直恢复失败?

93

0

0

Flink CDC写paimon表，配置文件指定filesystem，但是出现dlf异常有遇到吗？

89

1

0

使用自建RDS的新建Hadoop集群Hive组件状态异常

103

1

0

Flink的sink表中，处理时间比较早的结果数据晚于处理时间较晚的，导致结果表数据异常，怎么回事？

243

0

0

Flink CDC里提交两个任务读取sqlserver cdc怎么办？

288

1

0

Flink CDC里提交任务的时候，卡死，查日志也没查出哪里报错，要怎么办？

174

0

0

flink cdc加个字段就异常怎么办？

238

0

0

问答排行榜

最热

最新

【大咖问答】对话PostgreSQL 中国社区发起人之一，阿里云数据库高级专家德哥

据说在家办公的程序员是这样写代码的？

如何升级配置

【藏经阁一起读（27）】本周推荐《Apache Flink案例集（2022版）》，你有哪些心得？

【精品问答】python技术1000问(1)

copaw安装后，出现这个情况，在设置模型的过程中出现这个问题，如何解决

copaw安装后选择ollma为啥报错不能安装相关模型？

建议通义灵码参考字节的trae ，可以自主选择一些开源的模型

云端部署coclaw报错

如何查看 Coding Plan 额度使用情况？

相关文章

吃透 RocketMQ

Quick BI即席分析：企业如何用10分钟跑赢大促复盘？

「RDS DuckDB 实训营」火热进行中！3月3日正式开营，参营即享多重好礼！

外卖配送开发系统的订单状态流转与结算逻辑详解

智能数据库运维大脑 DAS Agent 邀您开启 AI 驱动的数据库自治之旅！

还有其他疑问?