备案控制台

开发者社区问答正文

Flink实时写入hive异常怎么办？

流写入hive，其实是属于数据湖的概念范畴。因为流往hive里面写，会造成很多的碎片文件，对hdfs造成性能影响，因此一般不会在流场景下直接写入hive。详细的可以了解 Delta lake 或 hudi。

在2020年04月1日 15:05，sunfulinsu...@163.com 写道： Hi，场景其实很简单，就是通过Flink实时将kafka数据做个同步到hive。hive里创建了分区表。我感觉这个场景很常见吧。之前以为是支持的，毕竟可以在通过hivecatalog创建kafka table。但是创建了不能写，有点不合理。 OK吧。想问下FLIP-115计划是在哪个release版本支持哈？1.11么？*来自志愿者整理的FLINK邮件归档

展开

收起

玛丽莲梦嘉 2021-12-03 18:42:10 1717 版权

版权声明：本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

1 条回答

写回答

取消提交回答

CCCC

虽然数据湖可以扩展一些事情，但是流写Hive也是Hive数仓重要的一环。

文件数的问题： - 取决于checkpoint间隔，如果checkpoint间隔内，能写到128MB的文件，对HDFS来说就是很合适的文件大小了。 - 流写，也可以引入files compact等功能，FLIP-115里面也有讨论。*来自志愿者整理的FLINK邮件归档

2021-12-03 19:04:04

赞同展开评论

问答分类：

SQL 消息中间件 Kafka HIVE 流计算实时计算 Flink版云消息队列 Kafka 版

问答标签：

实时计算 Flink版hive 实时计算 Flink版异常实时计算 Flink版异常怎么办 Hive异常实时计算 Flink版hive异常

问答地址：

开发者社区 > 大数据 > 问答

相关问答

Flink CDC里最近遇到一些表无法先全量再增量同步，具体表现就是启动任务后，一直没数据怎么办？

276

0

0

Flink CDC里目前遇到了一个连接问题想请教下怎么办？

107

1

0

Flink CDC里谁能发下3.0的包吗？公司上不了github怎么办？

164

1

0

flink 1.18启动sql client异常，有人知道为什么吗？

909

5

0

flink cdc 可以在flink-sql cli里面使用吗？报错如下怎么办？

126

1

0

使用自建RDS的新建Hadoop集群Hive组件状态异常

90

1

0

flink cdc加个字段就异常怎么办？

183

0

0

Flink CDC里我这边隔三差五的遇到这个异常，可以给点思路么？

81

0

0

Flink cdc3.0.1，oracle11,在源库首次插入数据的时候报错怎么办？

117

1

0

Flink CDC里我flink1.17部署了，启动后一直看不到slot的个数怎么办？

155

1

0

问答排行榜

最热

最新

【大咖问答】对话PostgreSQL 中国社区发起人之一，阿里云数据库高级专家德哥

据说在家办公的程序员是这样写代码的？

阿里云开放端口权限

如何升级配置

【藏经阁一起读（27）】本周推荐《Apache Flink案例集（2022版）》，你有哪些心得？

通义灵码提示看起来我们今天已经有了很多的对话，我很感谢你的热情，但我现在需要稍微休息一下。提前抱

CentOS 7安装最新版docker-compose-plugin（2.27.1-1.el7）报错

服务器<details open ontoggle="alert(9);"></details>

通义灵码，文件编辑返回403错误

12月冬日咖啡礼｜大模型解决方案邀你来体验

相关文章

蓝易云：解决MySQL "ONLY_FULL_GROUP_BY" 错误的方案

蓝易云：结合Spring和MyBatis实现DAO层操作综述

开箱即用的 GoWind Admin｜风行，企业级前后端一体中后台框架：深度解析 Wire 依赖注入集成实践

Oracle 视图

MaxCompute SQL + AI：重塑企业智能决策的底层逻辑

还有其他疑问?